Spaces:

mrsk1883
/

testingspace

Sleeping

mrsk1883 commited on Dec 9, 2023

Commit

5cecb0e

1 Parent(s): f8b4423

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,27 +1,16 @@
 import gradio as gr
-from PyPDF2 import PdfReader
 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
-from gtts import gTTS
-from io import BytesIO
-# IPython check
-try:
-    from IPython.display import Audio
-    ipython_available = True
-except ImportError:
-    ipython_available = False
-# Model
 model_name = "ArtifactAI/led_large_16384_arxiv_summarization"
-model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-def summarize_pdf_abstract(pdf_bytes):
     try:
-        reader = PdfReader(pdf_bytes)
-        abstract_text = ""
         for page in reader.pages:
             if "Abstract" in page.extract_text() or "Introduction" in page.extract_text():
                 abstract_text = page.extract_text()
@@ -29,22 +18,17 @@ def summarize_pdf_abstract(pdf_bytes):
         inputs = tokenizer(abstract_text, return_tensors="pt")
         outputs = model.generate(**inputs)
-        summary = tokenizer.decode(outputs[0])
-        if ipython_available:
-            speech = gTTS(text=summary, lang="en")
-            speech_bytes = speech.get_wav_data()
-        else:
-            speech_bytes = None
-        return {"summary": summary, "audio": speech_bytes}
     except Exception as e:
         raise Exception(str(e))
-if ipython_available:
-    interface = gr.Interface(...)
-else:
-    interface = gr.Interface(...)
-interface.launch()

 import gradio as gr
+from PyPDF2 import PdfReader
 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 model_name = "ArtifactAI/led_large_16384_arxiv_summarization"
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+def summarize_pdf_abstract(pdf_file):
     try:
+        reader = PdfReader(pdf_file)
+        abstract_text = ""
         for page in reader.pages:
             if "Abstract" in page.extract_text() or "Introduction" in page.extract_text():
                 abstract_text = page.extract_text()
         inputs = tokenizer(abstract_text, return_tensors="pt")
         outputs = model.generate(**inputs)
+        summary = tokenizer.decode(outputs[0])
+        return {"summary": summary}
     except Exception as e:
         raise Exception(str(e))
+interface = gr.Interface(
+    fn=summarize_pdf_abstract,
+    inputs=gr.inputs.File(label="Upload PDF"),
+    outputs=gr.outputs.Textbox(label="Summary")
+)
+interface.launch(share=True)