Spaces:

autosummproject
/

autosumm

Runtime error

App Files Files Community

autosumm / app.py

mhsvieira

Add translation

c16fec3 over 3 years ago

raw

history blame

3.67 kB

	import streamlit as st
	from extractor import extract, FewDocumentsError
	from summarizer import summarize
	from translation import translate
	import time
	import cProfile
	from sentence_transformers import SentenceTransformer
	from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
	import torch

	@st.cache(allow_output_mutation=True)
	def init():
	# Dowload required NLTK resources
	from nltk import download
	download('punkt')
	download('stopwords')

	device = "cuda" if torch.cuda.is_available() else "cpu"
	# Model for semantic searches
	search_model = SentenceTransformer('msmarco-distilbert-base-v4', device=device)
	# Model for abstraction
	summ_model = AutoModelForSeq2SeqLM.from_pretrained('t5-base')
	tokenizer = AutoTokenizer.from_pretrained('t5-base')

	return search_model, summ_model, tokenizer

	def main():
	search_model, summ_model, tokenizer = init()

	st.title("AutoSumm")
	st.subheader("Lucas Antunes & Matheus Vieira")

	portuguese = st.checkbox('Traduzir para o português.')

	if portuguese:
	st.subheader("Digite o tópico sobre o qual você deseja gerar um resumo")
	query_pt = st.text_input('Digite o tópico') #text is stored in this variable
	button = st.button('Gerar resumo')
	else:
	st.subheader("Type the desired topic to generate the summary")
	query = st.text_input('Type your topic') #text is stored in this variable
	button = st.button('Generate summary')

	if 'few_documents' not in st.session_state:
	st.session_state['few_documents'] = False
	few_documents = False
	else:
	few_documents = st.session_state['few_documents']

	if button:
	start_time = time.time()
	query = translate(query_pt, 'pt', 'en') if portuguese else query
	try:
	with st.spinner('Extraindo textos relevantes...'):
	text = extract(query, search_model=search_model)
	except FewDocumentsError as e:
	few_documents = True
	st.session_state['few_documents'] = True
	st.session_state['documents'] = e.documents
	st.session_state['msg'] = e.msg
	else:

	st.info(f'(Extraction) Elapsed time: {time.time() - start_time:.2f}s')
	with st.spinner('Gerando resumo...'):
	summary = summarize(text, summ_model, tokenizer)
	st.info(f'(Total) Elapsed time: {time.time() - start_time:.2f}s')

	if portuguese:
	st.markdown(f'Seu resumo para "{query_pt}":\n\n> {translate(summary, "en", "pt")}')
	else:
	st.markdown(f'Your summary for "{query}":\n\n> {summary}')


	if few_documents:
	st.warning(st.session_state['msg'])
	if st.button('Prosseguir'):
	start_time = time.time()
	with st.spinner('Extraindo textos relevantes...'):
	text = extract(query, search_model=search_model, extracted_documents=st.session_state['documents'])
	st.info(f'(Extraction) Elapsed time: {time.time() - start_time:.2f}s')
	with st.spinner('Gerando resumo...'):
	summary = summarize(text, summ_model, tokenizer)
	st.info(f'(Total) Elapsed time: {time.time() - start_time:.2f}s')

	if portuguese:
	st.markdown(f'Seu resumo para "{query_pt}":\n\n> {translate(summary, "en", "pt")}')
	else:
	st.markdown(f'Your summary for "{query}":\n\n> {summary}')

	st.session_state['few_documents'] = False
	few_documents = False

	if __name__ == '__main__':
	cProfile.run('main()', 'stats.txt')