Spaces:

EnzoBustos
/

TuringVideos

Sleeping

App Files Files Community

EnzoBustos commited on Nov 10, 2023

Commit

a9eb918

1 Parent(s): 3d30741

Create app.py with english functionality

Browse files

Create the app.py file with the dependencies and streamlit interface and implement the english pipelines

Files changed (1) hide show

app.py +102 -0

app.py ADDED Viewed

	@@ -0,0 +1,102 @@

+import yt_dlp
+import whisper
+import os
+import transformers
+from transformers import pipeline
+import torch
+from summarizer import Summarizer
+#Download youtube video
+def download_audio(link):
+    with yt_dlp.YoutubeDL({'extract_audio': True, 'format': 'bestaudio', 'outtmpl': 'video.mp3'}) as video:
+        info_dict = video.extract_info(link, download = True)
+        video_title = info_dict['title']
+        video.download(link)
+        return video_title
+#def portuguese_sum_pipeline(link):
+#    video_title = download_audio(link)
+def english_sum_pipeline(link):
+    video_title = download_audio(link)
+    #audio-to-text
+    transcriptor = whisper.load_model("base.en")
+    directory = os.getcwd()
+    result = model.transcribe(os.path.join(directory, "video.mp3"))
+    transcript_text = result["text"]
+    #extractive summarization
+    extractive_model = Summarizer()
+    extractive = extractive_model(transcript_text, num_sentences=15)
+    #abstractive summarization
+    device_num = 0 if torch.cuda.is_available() else -1
+    abstractive_summarizer = pipeline("summarization", model="facebook/bart-large-cnn", tokenizer="facebook/bart-large-cnn", device=device_num)
+    output_text = abstractive_summarizer(extractive)[0]["summary_text"]
+    return transcript_text, output_text
+def english_qa_pipeline(question, context):
+    nlp = pipeline("question-answering", model='distilbert-base-uncased-distilled-squad')
+    result = nlp(question=question, context=context)
+    return result["answer"]
+#Collect inputs and create the interface
+def main():
+    header = st.container()
+    model = st.container()
+    model_1, model_2 = st.columns(2)
+    qa = st.container
+    qa_1, qa_2 = st.columns(2)
+    with header:
+        st.title("TuringVideos")
+        st.write("Este trabalho visa a criação de uma interface capaz de sumarizar e responder perguntas sobre um determinado vídeo em português ou inglês!")
+    with model:
+        st.header("Modelo para sumarização")
+        with model_1:
+            language = st.selectbox('Qual a linguagem do seu modelo?', ('Português (pt)', 'Inglês (en)', 'Outra'))
+            link = st.text_area(label="Coloque o link do seu vídeo do YouTube!", height=25, placeholder="Digite seu link...")
+            submit_1 = st.button('Gerar sumário!')
+        with model_2:
+            if submit_1:
+                if language == 'Português (pt)':
+                    #outputs = portuguese_sum_pipeline(link)
+                    st.write("Modelo ainda não implementado.")
+                elif language == 'Inglês (en)':
+                    outputs = english_sum_pipeline(link)
+                else:
+                    st.write("Erro na seleção de linguagem.")
+                st.write("Sumário.....................................................................: \n {} \n \n".format(outputs[1]))
+    with qa:
+        st.header("Modelo para resposta de perguntas")
+        with model_1:
+            question = st.text_area(label="Digite sua pergunta para o modelo", height=25, placeholder="Digite sua pergunta...")
+            submit = st.button('Gerar resposta!')
+        with model_2:
+            if submit_2:
+                if language == 'Português (pt)':
+                    #answer = portuguese_qa_pipeline(link)
+                    st.write("Modelo ainda não implementado.")
+                elif language == 'Inglês (en)':
+                    answer = english_qa_pipeline(question, outputs[0])
+                else:
+                    st.write("Erro na seleção de linguagem.")
+                st.write("Resposta.....................................................................: \n {} \n \n".format(answer))
+main()