Spaces:

prlabs2023
/

text-summarization-1

Runtime error

prlabs2023 commited on Jun 16, 2023

Commit

2937f03

1 Parent(s): 0c810f3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -28,19 +28,29 @@ from fastapi import Form
 class Query(BaseModel):
     text: str
-device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
-tokenizer = BertTokenizerFast.from_pretrained('mrm8488/bert-small2bert-small-finetuned-cnn_daily_mail-summarization')
-model = EncoderDecoderModel.from_pretrained('mrm8488/bert-small2bert-small-finetuned-cnn_daily_mail-summarization').to(device)
 def generate_summary(text):
     # cut off at BERT max length 512
-    inputs = tokenizer([text], padding="max_length", truncation=True, max_length=512, return_tensors="pt")
-    input_ids = inputs.input_ids.to(device)
-    attention_mask = inputs.attention_mask.to(device)
-    output = model.generate(input_ids, attention_mask=attention_mask)
-    return tokenizer.decode(output[0], skip_special_tokens=True)
 from fastapi import FastAPI, Request, Depends, UploadFile, File
@@ -93,6 +103,4 @@ async def get_answer(q: Query ):
     return "hello"

 class Query(BaseModel):
     text: str
+# device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
+# tokenizer = BertTokenizerFast.from_pretrained('mrm8488/bert-small2bert-small-finetuned-cnn_daily_mail-summarization')
+# model = EncoderDecoderModel.from_pretrained('mrm8488/bert-small2bert-small-finetuned-cnn_daily_mail-summarization').to(device)
+summarizer = pipeline(
+    "summarization",
+    "pszemraj/long-t5-tglobal-base-16384-book-summary",
+    device=0 if torch.cuda.is_available() else -1,
+)
 def generate_summary(text):
+    result = summarizer(text)
+    return result[0]["summary_text"]
     # cut off at BERT max length 512
+    # inputs = tokenizer([text], padding="max_length", truncation=True, max_length=512, return_tensors="pt")
+    # input_ids = inputs.input_ids.to(device)
+    # attention_mask = inputs.attention_mask.to(device)
+    # output = model.generate(input_ids, attention_mask=attention_mask)
+    # return tokenizer.decode(output[0], skip_special_tokens=True)
 from fastapi import FastAPI, Request, Depends, UploadFile, File
     return "hello"