Spaces:

Mattral
/

RAG-bot

Sleeping

Mattral commited on May 10, 2024

Commit

0cfd0bb

verified ·

1 Parent(s): c84b3b4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -65,21 +65,15 @@ def get_url_content(url):
         return None
 @st.cache_resource
 def get_retriever(urls):
-    documents = DocumentArray([get_url_content(url) for url in urls])
-    # Load the model and encode document texts directly
     model = SentenceTransformer('all-MiniLM-L6-v2')
-    documents.embeddings = model.encode(documents.texts, show_progress_bar=True)
-    # Applying HNSW for efficient similarity search
-    documents.embeddings.faiss.ann['HNSW'] = {'nlinks': 16}
     return documents
 @st.cache_resource
 def create_chain(_retriever):
     # A stream handler to direct streaming output on the chat screen.

         return None
 @st.cache_resource
 def get_retriever(urls):
+    documents = DocumentArray([doc for url in urls if (doc := get_url_content(url)) is not None])
     model = SentenceTransformer('all-MiniLM-L6-v2')
+    documents.embeddings = model.encode([doc.text for doc in documents], show_progress_bar=True)
     return documents
 @st.cache_resource
 def create_chain(_retriever):
     # A stream handler to direct streaming output on the chat screen.