Spaces:

varl42
/

_demo42

Runtime error

varl42 commited on Dec 4, 2023

Commit

d740958

1 Parent(s): 830dbbc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,7 +6,7 @@ import numpy
 import scipy
 from gtts import gTTS
 from io import BytesIO
-from transformers import BartTokenizer, BartForConditionalGeneration
 def extract_text(pdf_file):
     pdfReader = PyPDF2.PdfReader(pdf_file)
@@ -27,14 +27,14 @@ def summarize_text(text):
     abstract = ". ".join(sentences[start:end+1])
     # Load BART model & tokenizer
-    tokenizer = BartTokenizer.from_pretrained("facebook/bart-large-cnn")
-    model = BartForConditionalGeneration.from_pretrained("facebook/bart-large-cnn")
     # Tokenize abstract
     inputs = tokenizer(abstract, return_tensors="pt", truncation=True)
     # Generate summary
-    summary_ids = model.generate(inputs['input_ids'], num_beams=4, max_length=45, min_length=30, early_stopping=True)
     summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
     return summary

 import scipy
 from gtts import gTTS
 from io import BytesIO
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 def extract_text(pdf_file):
     pdfReader = PyPDF2.PdfReader(pdf_file)
     abstract = ". ".join(sentences[start:end+1])
     # Load BART model & tokenizer
+    tokenizer = AutoTokenizer.from_pretrained("facebook/bart-large-cnn")
+    model = AutoModelForSeq2SeqLM.from_pretrained("facebook/bart-large-cnn")
     # Tokenize abstract
     inputs = tokenizer(abstract, return_tensors="pt", truncation=True)
     # Generate summary
+    summary_ids = model.generate(inputs['input_ids'], num_beams=5, max_length=45, min_length=30, early_stopping=True)
     summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
     return summary