Spaces:

dammy
/

chatPDF

Runtime error

dammy commited on Nov 16, 2023

Commit

bb53d04

1 Parent(s): 065d9fd

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -44,29 +44,37 @@ def local_query(query, context):
 def run_query(btn, history, query):
-    file_name = btn.name
-    loader = PDFMinerLoader(file_name)
-    doc = loader.load()
-    text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
-    texts = text_splitter.split_documents(doc)
-    texts = [i.page_content for i in texts]
-    doc_emb = st_model.encode(texts)
-    doc_emb = doc_emb.tolist()
-    ids = [str(uuid.uuid1()) for _ in doc_emb]
-    client = chromadb.Client()
-    collection = client.create_collection("test_db")
-    collection.add(
-        embeddings=doc_emb,
-        documents=texts,
-        ids=ids
-    )

 def run_query(btn, history, query):
+    global count
+    count = 1
+    if count ==1:
+        file_name = btn.name
+        loader = PDFMinerLoader(file_name)
+        doc = loader.load()
+        text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
+        texts = text_splitter.split_documents(doc)
+        texts = [i.page_content for i in texts]
+        doc_emb = st_model.encode(texts)
+        doc_emb = doc_emb.tolist()
+        ids = [str(uuid.uuid1()) for _ in doc_emb]
+        client = chromadb.Client()
+        collection = client.create_collection("test_db")
+        collection.add(
+            embeddings=doc_emb,
+            documents=texts,
+            ids=ids
+        )
+        count+=1