Spaces:

Kr08
/

ASR_gradio

Build error

App Files Files Community

Kr08 commited on Sep 4, 2024

Commit

9148c64

verified ·

1 Parent(s): a050ac4

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -10

app.py CHANGED Viewed

@@ -1,20 +1,19 @@
 import gradio as gr
 from audio_processing import process_audio, print_results
-from transformers import pipeline
 import spaces
 import torch
 # Check if CUDA is available
 cuda_available = torch.cuda.is_available()
 # Initialize the summarization and question-answering models
-summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
-qa_model = pipeline("question-answering", model="distilbert-base-cased-distilled-squad")
-# Move models to GPU if available
-if cuda_available:
-    summarizer.to('cuda')
-    qa_model.to('cuda')
 @spaces.GPU
 def transcribe_audio(audio_file, translate, model_size):
@@ -41,13 +40,19 @@ def transcribe_audio(audio_file, translate, model_size):
 @spaces.GPU
 def summarize_text(text):
-    summary = summarizer(text, max_length=150, min_length=50, do_sample=False)[0]['summary_text']
     return summary
 @spaces.GPU
 def answer_question(context, question):
-    result = qa_model(question=question, context=context)
-    return result['answer']
 @spaces.GPU
 def process_and_summarize(audio_file, translate, model_size):

 import gradio as gr
 from audio_processing import process_audio, print_results
+from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqLM, AutoModelForQuestionAnswering
 import spaces
 import torch
 # Check if CUDA is available
 cuda_available = torch.cuda.is_available()
+device = "cuda" if cuda_available else "cpu"
 # Initialize the summarization and question-answering models
+summarizer_model = AutoModelForSeq2SeqLM.from_pretrained("facebook/bart-large-cnn").to(device)
+summarizer_tokenizer = AutoTokenizer.from_pretrained("facebook/bart-large-cnn")
+qa_model = AutoModelForQuestionAnswering.from_pretrained("distilbert-base-cased-distilled-squad").to(device)
+qa_tokenizer = AutoTokenizer.from_pretrained("distilbert-base-cased-distilled-squad")
 @spaces.GPU
 def transcribe_audio(audio_file, translate, model_size):
 @spaces.GPU
 def summarize_text(text):
+    inputs = summarizer_tokenizer(text, max_length=1024, truncation=True, return_tensors="pt").to(device)
+    summary_ids = summarizer_model.generate(inputs["input_ids"], max_length=150, min_length=50, do_sample=False)
+    summary = summarizer_tokenizer.decode(summary_ids[0], skip_special_tokens=True)
     return summary
 @spaces.GPU
 def answer_question(context, question):
+    inputs = qa_tokenizer(question, context, return_tensors="pt").to(device)
+    outputs = qa_model(**inputs)
+    answer_start = torch.argmax(outputs.start_logits)
+    answer_end = torch.argmax(outputs.end_logits) + 1
+    answer = qa_tokenizer.decode(inputs["input_ids"][0][answer_start:answer_end])
+    return answer
 @spaces.GPU
 def process_and_summarize(audio_file, translate, model_size):