Spaces:

Jiangxz
/

Taiwan_Tax_KB

Runtime error

App Files Files

Jiangxz commited on Sep 13, 2024

Commit

8e2dc9e

verified ·

1 Parent(s): 131ab57

Update app.py

Browse files

Taiwan_Tax_Knowledge-base

Files changed (1) hide show

app.py +4 -3

app.py CHANGED Viewed

@@ -10,7 +10,7 @@ from langchain_groq import ChatGroq
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_community.vectorstores import Chroma
-from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.chains import RetrievalQA
 from langchain_community.document_loaders import WebBaseLoader, TextLoader
 from langchain.prompts import PromptTemplate
@@ -74,18 +74,19 @@ text_splitter = RecursiveCharacterTextSplitter(
 )
 split_docs = text_splitter.split_documents(documents)
-print(f"分割後的文檔數量：{len(split_docs)}")
 embeddings = HuggingFaceEmbeddings(model_name="BAAI/bge-large-zh-v1.5")
 print(f"\n成功初始化嵌入模型")
 vectorstore = Chroma.from_documents(split_docs, embeddings, persist_directory="./Knowledge-base")
 print(f"成功建立 Chroma 向量資料庫")
 retriever = vectorstore.as_retriever(search_kwargs={"k": 2})
 template = """Let's work this out in a step by step way to be sure we have the right answer. Must reply to me in Taiwanese Traditional Chinese.
-在回答之前，請仔細分析檢索到的上下文，確保你的回答準確完整反映了上下文中的訊息，而不是依賴先前的知識，在回應答案中不要提到是根據上下文回答。
 如果檢索到的多個上下文之間存在聯繫，請整合這些訊息以提供全面的回答，但要避免過度推斷。
 如果檢索到的上下文不包含足夠回答問題的訊息，請誠實的說明，不要試圖編造答案。

 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_community.vectorstores import Chroma
+from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain.chains import RetrievalQA
 from langchain_community.document_loaders import WebBaseLoader, TextLoader
 from langchain.prompts import PromptTemplate
 )
 split_docs = text_splitter.split_documents(documents)
+print(f"分割後的文件數量：{len(split_docs)}")
 embeddings = HuggingFaceEmbeddings(model_name="BAAI/bge-large-zh-v1.5")
 print(f"\n成功初始化嵌入模型")
+print(f"開始建立向量資料庫")
 vectorstore = Chroma.from_documents(split_docs, embeddings, persist_directory="./Knowledge-base")
 print(f"成功建立 Chroma 向量資料庫")
 retriever = vectorstore.as_retriever(search_kwargs={"k": 2})
 template = """Let's work this out in a step by step way to be sure we have the right answer. Must reply to me in Taiwanese Traditional Chinese.
+在回答之前，請仔細分析檢索到的上下文，確保你的回答準確完整反映了上下文中的訊息，而不是依賴先前的知識，在回應的答案中不要提到是根據上下文回答。
 如果檢索到的多個上下文之間存在聯繫，請整合這些訊息以提供全面的回答，但要避免過度推斷。
 如果檢索到的上下文不包含足夠回答問題的訊息，請誠實的說明，不要試圖編造答案。