Spaces:

christian1984
/

Sissa2

Sleeping

christian1984 commited on Feb 6

Commit

5e5a267

verified ·

1 Parent(s): 7373789

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -33,42 +33,41 @@ def upload_pdf(file):
 def load_pdf(file_path):
     """Load text from the PDF"""
-  loader = PDFPlumberLoader(file_path)
-  documents = loader.load()
-  return documents
 def split_text(documents):
     """Split text into smaller chunks"""
-  text_splitter = RecursiveCharacterTextSplitter(
-      chunk_size=1000,
-      chunk_overlap=200,
-      add_start_index=True,
-  )
-  return text_splitter.split_documents(documents)
 def index_docs(documents):
-  vector_store.add_documents(documents)
 def retrieve_docs(query):
     """Retrieve similar documents"""
-  return vector_store.similarity_search(query)
 def query_huggingface_api(prompt):
     """Send query to DeepSeek R1 model on Hugging Face"""
-  payload = {"inputs": prompt}
-  response = requests.post(HF_API_URL, headers=HEADERS, json=payload)
-  if response.status_code == 200:
-      return response.json()[0]["generated_text"]
-  else:
-      return "Error: Unable to process request."
 def answer_question(question, documents):
@@ -80,7 +79,11 @@ def answer_question(question, documents):
 st.title("PDF-based RAG Chatbot")
-uploaded_file = st.file_uploader("Upload PDF", type="pdf", accept_multiple_files=False)
 if uploaded_file:
     upload_pdf(uploaded_file)

 def load_pdf(file_path):
     """Load text from the PDF"""
+    loader = PDFPlumberLoader(file_path)
+    documents = loader.load()
+    return documents
 def split_text(documents):
     """Split text into smaller chunks"""
+    text_splitter = RecursiveCharacterTextSplitter(
+        chunk_size=1000,
+        chunk_overlap=200,
+        add_start_index=True,
+    )
+    return text_splitter.split_documents(documents)
 def index_docs(documents):
+    vector_store.add_documents(documents)
 def retrieve_docs(query):
     """Retrieve similar documents"""
+    return vector_store.similarity_search(query)
 def query_huggingface_api(prompt):
     """Send query to DeepSeek R1 model on Hugging Face"""
+    payload = {"inputs": prompt}
+    response = requests.post(HF_API_URL, headers=HEADERS, json=payload)
+    if response.status_code == 200:
+        return response.json()[0]["generated_text"]
+    else:
+        return "Error: Unable to process request."
 def answer_question(question, documents):
 st.title("PDF-based RAG Chatbot")
+uploaded_file = st.file_uploader(
+    "Upload PDF",
+    type="pdf",
+    accept_multiple_files=False
+)
 if uploaded_file:
     upload_pdf(uploaded_file)