Spaces:

mehradans92
/

decode-elm

Sleeping

App Files Files Community

mehradans92 commited on Feb 12, 2023

Commit

ce5740f

1 Parent(s): 223116a

Adde api key warning

Browse files

Files changed (1) hide show

app.py +23 -23

app.py CHANGED Viewed

@@ -10,6 +10,7 @@ import shutil
 import pickle
 docs = None
 #title
 st.title("Encode knowledge from papers with cited references")
@@ -20,11 +21,11 @@ api_key_url = 'https://help.openai.com/en/articles/4936850-where-do-i-find-my-se
 api_key = st.text_input('OpenAI API Key',
          placeholder='sk-...',
          help=f"['What is that?']({api_key_url})",
-         type="password")
-# st.write('The current movie title is', title)
-api_key = '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'
 os.environ["OPENAI_API_KEY"] = f"{api_key}" #
 import paperqa
@@ -83,10 +84,10 @@ def call_arXiv_API(search_query, search_by='all', sort_by='relevance', max_resul
     pdf_info=list(zip(pdf_titles, pdf_urls, pdf_authors, pdf_categories, folder_names, pdf_citation))
     # Check number of available files
-    print('Requesting {max_results} files'.format(max_results=max_results))
     if len(pdf_urls)<int(max_results):
         matching_pdf_num=len(pdf_urls)
-        print('Only {matching_pdf_num} files available'.format(matching_pdf_num=matching_pdf_num))
     return pdf_info, pdf_citation
@@ -95,7 +96,7 @@ def download_pdf(pdf_info):
     # if len(os.listdir(f'./{folder_name}') ) != 0:
             # check folder is empty to avoid using papers from old runs:
             # os.remove(f'./{folder_name}/*')
     for i,p in enumerate(stqdm(pdf_info, desc='Searching and downloading papers')):
         pdf_title=p[0]
@@ -115,18 +116,15 @@ def download_pdf(pdf_info):
             currP.write(r.content)
         if i == 0:
             st.markdown("###### Papers found:")
-        st.markdown(f'{i+1}. {pdf_citation}')
-# #subtitle
-# st.markdown("## Optical Character Recognition - Using `easyocr`, `streamlit` -  hosted on 🤗 Spaces")
-# st.markdown("Link to the app - [image-to-text-app on 🤗 Spaces](https://huggingface.co/spaces/Amrrs/image-to-text-app)")
-# #image uploader
-# image = st.file_uploader(label = "Upload your image here",type=['png','jpg','jpeg'])
 max_results_current = 1
 max_results = max_results_current
@@ -144,7 +142,7 @@ def search_click_callback(search_query, max_results):
 with st.form(key='columns_in_form', clear_on_submit = False):
     c1, c2 = st.columns([8,1])
     with c1:
-        search_query = st.text_input("Input search query here:", placeholder='Keywords for most relevant search...', value='CFD modeling'
                                        )#search_query, max_results_current))
     with c2:
@@ -158,7 +156,7 @@ if searchButton:
     pdf_info =  search_click_callback(search_query, max_results)
     if 'pdf_info' not in st.session_state:
         st.session_state['pdf_info'] = pdf_info
-    print(f'This is PDF info from search:{pdf_info}')
 # def tokenize_callback():
@@ -196,14 +194,14 @@ def answer_callback(question_query):
     if docs is None:
         # my_bar.progress(0.2, "Please wait...")
         pdf_info = st.session_state['pdf_info']
-        print('buliding docs')
         docs = paperqa.Docs()
         pdf_paths = [f"{p[4]}/{p[0]}.pdf" for p in pdf_info]
         pdf_citations = [p[5] for p in pdf_info]
         print(list(zip(pdf_paths, pdf_citations)))
-        for d, c in stqdm(zip(pdf_paths, pdf_citations)):
-            print(d,c)
             docs.add(d, c)
     # docs._build_faiss_index()
     answer = docs.query(question_query)
@@ -216,10 +214,12 @@ def answer_callback(question_query):
 form = st.form(key='question_form')
 question_query = form.text_input("What do you wanna know from these papers?", placeholder='Input questions here...',
-                value='Write 50 words on CFD modeling')
 submitButton = form.form_submit_button('Submit')
 if submitButton:
     st.text_area("Answer:", answer_callback(question_query), height=600)
 # with st.form(key='question_form', clear_on_submit = False):

 import pickle
 docs = None
+api_key = ''
 #title
 st.title("Encode knowledge from papers with cited references")
 api_key = st.text_input('OpenAI API Key',
          placeholder='sk-...',
          help=f"['What is that?']({api_key_url})",
+         type="password")
 os.environ["OPENAI_API_KEY"] = f"{api_key}" #
+if len(api_key) != 51:
+    st.warning('Please enter a valid OpenAI API key.', icon="⚠️")
 import paperqa
     pdf_info=list(zip(pdf_titles, pdf_urls, pdf_authors, pdf_categories, folder_names, pdf_citation))
     # Check number of available files
+    # print('Requesting {max_results} files'.format(max_results=max_results))
     if len(pdf_urls)<int(max_results):
         matching_pdf_num=len(pdf_urls)
+        # print('Only {matching_pdf_num} files available'.format(matching_pdf_num=matching_pdf_num))
     return pdf_info, pdf_citation
     # if len(os.listdir(f'./{folder_name}') ) != 0:
             # check folder is empty to avoid using papers from old runs:
             # os.remove(f'./{folder_name}/*')
+    all_reference_text = []
     for i,p in enumerate(stqdm(pdf_info, desc='Searching and downloading papers')):
         pdf_title=p[0]
             currP.write(r.content)
         if i == 0:
             st.markdown("###### Papers found:")
+        st.markdown(f"{i+1}. {pdf_citation}")
+        time.sleep(0.15)
+        all_reference_text.append(f"{i+1}. {pdf_citation}\n")
+    if 'all_reference_text' not in st.session_state:
+        st.session_state['all_reference_text'] = ' '.join(all_reference_text)
+    # print(all_reference_text)
 max_results_current = 1
 max_results = max_results_current
 with st.form(key='columns_in_form', clear_on_submit = False):
     c1, c2 = st.columns([8,1])
     with c1:
+        search_query = st.text_input("Input search query here:", placeholder='Keywords for most relevant search...', value=''
                                        )#search_query, max_results_current))
     with c2:
     pdf_info =  search_click_callback(search_query, max_results)
     if 'pdf_info' not in st.session_state:
         st.session_state['pdf_info'] = pdf_info
+    # print(f'This is PDF info from search:{pdf_info}')
 # def tokenize_callback():
     if docs is None:
         # my_bar.progress(0.2, "Please wait...")
         pdf_info = st.session_state['pdf_info']
+        # print('buliding docs')
         docs = paperqa.Docs()
         pdf_paths = [f"{p[4]}/{p[0]}.pdf" for p in pdf_info]
         pdf_citations = [p[5] for p in pdf_info]
         print(list(zip(pdf_paths, pdf_citations)))
+        for d, c in zip(pdf_paths, pdf_citations):
+            # print(d,c)
             docs.add(d, c)
     # docs._build_faiss_index()
     answer = docs.query(question_query)
 form = st.form(key='question_form')
 question_query = form.text_input("What do you wanna know from these papers?", placeholder='Input questions here...',
+                value='')
 submitButton = form.form_submit_button('Submit')
 if submitButton:
+    with st.expander("Found papers:", expanded=True):
+        st.write(f"{st.session_state['all_reference_text']}")
     st.text_area("Answer:", answer_callback(question_query), height=600)
 # with st.form(key='question_form', clear_on_submit = False):