Spaces:

samim2024
/

PDF-RAG

Running

samim2024 commited on Jul 20, 2024

Commit

85cdbf8

verified ·

1 Parent(s): 640cf86

Update rag.py

Files changed (1) hide show

rag.py CHANGED Viewed

@@ -10,6 +10,14 @@ from langchain.vectorstores.utils import filter_complex_metadata
 #add new import
 from langchain_community.document_loaders.csv_loader import CSVLoader
 class ChatPDF:
@@ -38,7 +46,7 @@ class ChatPDF:
         chunks = self.text_splitter.split_documents(docs)
         chunks = filter_complex_metadata(chunks)
-        vector_store = Chroma.from_documents(documents=chunks, embedding=FastEmbedEmbeddings())
         self.retriever = vector_store.as_retriever(
             search_type="similarity_score_threshold",
             search_kwargs={

 #add new import
 from langchain_community.document_loaders.csv_loader import CSVLoader
+from sentence_transformers import SentenceTransformer
+from langchain_community.embeddings import HuggingFaceEmbeddings
+model_name = "sentence-transformers/all-mpnet-base-v2"
+embedding = HuggingFaceEmbeddings(
+    model_name=model_name,
+   )
 class ChatPDF:
         chunks = self.text_splitter.split_documents(docs)
         chunks = filter_complex_metadata(chunks)
+        vector_store = Chroma.from_documents(documents=chunks, embedding=embedding)
         self.retriever = vector_store.as_retriever(
             search_type="similarity_score_threshold",
             search_kwargs={