pdfchat

Runtime error

App Files Files Community

kamau1 commited on Feb 8, 2024

Commit

e6d52ea

verified ·

1 Parent(s): e762464

Update app.py

Browse files

Files changed (1) hide show

app.py +25 -11

app.py CHANGED Viewed

@@ -1,3 +1,8 @@
 from langchain.text_splitter import CharacterTextSplitter
 from langchain.embeddings import HuggingFaceBgeEmbeddings
 from langchain.vectorstores import FAISS
@@ -51,12 +56,13 @@ def translate(userinput, target_lang, source_lang=None):
       translation = result['translated_text']
       return source_lange, translation
-def get_pdf_text(pdf_docs : list) -> str:
-    text = ""
-    for pdf in pdf_docs:
-        pdf_reader = PdfReader(pdf)
-        for page in pdf_reader.pages:
-            text += page.extract_text()
     return text
@@ -96,13 +102,11 @@ def get_conversation_chain(vectorstore:FAISS) -> ConversationalRetrievalChain:
 def main():
     st.title("SemaNaPDF📚")
     # upload file
-    pdf_docs = st.file_uploader(
-            "Upload your PDFs here and click on 'Process'", accept_multiple_files=True
-        )
-    if pdf_docs is not None:
         with st.spinner("processing"):
             # get pdf text
-            raw_text = get_pdf_text(pdf_docs)
             # get the text chunks
             text_chunks = get_text_chunks(raw_text)
@@ -133,6 +137,16 @@ def main():
             st.markdown(response)
             st.session_state.messages.append({"role": "assistant", "content": response})
 if __name__ == '__main__':
     main()

+"""
+    creator: Lewis Kamau Kimaru
+    Function: chat with pdf documents in different languages
+"""
 from langchain.text_splitter import CharacterTextSplitter
 from langchain.embeddings import HuggingFaceBgeEmbeddings
 from langchain.vectorstores import FAISS
       translation = result['translated_text']
       return source_lange, translation
+def get_pdf_text(pdf : Union[str, bytes, bytearray]) -> str:
+    reader = PdfReader(pdf)
+        pdf_text = ''
+        for page in (reader.pages):
+            text = page.extract_text()
+            if text:
+              pdf_text += text
     return text
 def main():
     st.title("SemaNaPDF📚")
     # upload file
+    pdf = st.file_uploader("Upload a PDF Document", type="pdf")
+    if pdf is not None:
         with st.spinner("processing"):
             # get pdf text
+            raw_text = get_pdf_text(pdf)
             # get the text chunks
             text_chunks = get_text_chunks(raw_text)
             st.markdown(response)
             st.session_state.messages.append({"role": "assistant", "content": response})
+    # Signature
+    st.markdown(
+        """
+        <div style="position: fixed; bottom: 0; right: 0; padding: 10px;">
+            <a href="https://kamaukimaru.vercel.app" target="_blank" rel="noopener noreferrer" style="font-size: 12px; color: #808080; text-decoration: none;">©2023 Lewis Kimaru. All rights reserved.</a>
+        </div>
+        """,
+        unsafe_allow_html=True
+    )
 if __name__ == '__main__':
     main()