Spaces:

hanchraizedai
/

semsearch

Sleeping

App Files Files

hanoch.rahimi@gmail commited on Nov 27, 2023

Commit

09df805

1 Parent(s): 7c3b5b3

ui changes

Browse files

Files changed (1) hide show

app.py +56 -43

app.py CHANGED Viewed

@@ -1,11 +1,11 @@
 import json
 from langchain.chains import RetrievalQA
 from langchain.embeddings.openai import OpenAIEmbeddings
 from langchain.prompts import PromptTemplate
 from langchain.vectorstores import Pinecone
 import pandas as pd
 from streamlit.runtime.state import session_state
 import openai
 import streamlit as st
@@ -45,6 +45,9 @@ country_geo = pd.read_csv(COUNTRIES_FN)
 st.session_state.index = utils.init_pinecone()
 st.session_state.db_search_results = []
 carddict = {
         "name": [],
         "company_id": [],
@@ -62,14 +65,21 @@ def init_models():
     retriever = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
     #reader = pipeline(tokenizer=model_name, model=model_name, task='question-answering')
     tokenizer = AutoTokenizer.from_pretrained(model_name)
-    #vectorstore = Pinecone(st.session_state.index, embed.embed_query, text_field)
-    # client.beta.assistants.create(
-    #     instructions=utils.assistant_instructions,
-    #     model="gpt-4-1106-preview",
-    #     tools=[{"type": "code_interpreter"}])
     return retriever, tokenizer#, vectorstore
 st.session_state.openai_client = oai.get_client()
 retriever, tokenizer = init_models()
 st.session_state.retriever = retriever
@@ -179,15 +189,15 @@ def run_query(query, report_type, top_k , regions, countries, is_debug, index_na
             with content_container:
                 for message in list(messages)[::-1]:
                     if hasattr(message, 'role'):
-                        print(f"\n-----\nMessage: {message}\n")
-                        with st.chat_message(name = message.role):
-                            st.write(message.content[0].text.value)
-                    # if message.role == "assistant":
-                    #     with st.chat_message(name = message.role, avatar = st.image("resources/raized_logo.png")):
-                    #         st.write(message.content[0].text.value)
-                    # else:
-                    #     with st.chat_message(name = message.role):
-                    #         st.write(message.content[0].text.value)
         # st.session_state.messages.append({"role": "user", "content": query})
         # st.session_state.messages.append({"role": "system", "content": m_text})
@@ -296,6 +306,9 @@ def run_query(query, report_type, top_k , regions, countries, is_debug, index_na
                 use_container_width=True)
 def render_history():
     with st.session_state.history_container:
@@ -328,7 +341,7 @@ if utils.check_password():
     if st.sidebar.button("New Conversation") or "messages" not in st.session_state:
         st.session_state.assistant_thread = st.session_state.openai_client.beta.threads.create()
         st.session_state.new_conversation = True
-        st.session_state.messages = [{"role":"system", "content":"Hello. I'm your startups discovery assistant."}]
     st.markdown("<h1 style='text-align: center; color: red; position: relative; top: -3rem;'>Raized.AI – Startups discovery demo</h1>", unsafe_allow_html=True)
@@ -366,32 +379,8 @@ if utils.check_password():
         unsafe_allow_html=True
     )
-    tab_search, tab_advanced = st.tabs(["Search", "Settings"])
-    assistants = st.session_state.openai_client.beta.assistants.list(
-        order="desc",
-        limit="20",
-    )
-    with tab_advanced:
-        #prompt_title = st.selectbox("Report Type", index = 0, options = utils.get_prompts(), on_change=on_prompt_selected, key="advanced_prompts_select", )
-        #prompt_title_editable = st.text_input("Title", key="prompt_title_editable")
-        report_type = st.selectbox(label="Response Type", options=["assistant", "standard", "guided", "company_list", "clustered"], index=0)
-        #assistant_id = st.text_input(label="Assistant ID", key="assistant_id", value = "asst_NHoxEosVlemDY7y5TYg8ftku") #value="asst_fkZtxo127nxKOCcwrwznuCs2")
-        assistant_id = st.selectbox(label="Assistant", options = [f"{a.id}|||{a.name}" for a in assistants])
-        default_prompt = st.text_area("Default Prompt", value = utils.default_prompt, height=400, key="advanced_default_prompt_content")
-        clustering_prompt = st.text_area("Clustering Prompt", value = utils.clustering_prompt, height=400, key="advanced_clustering_prompt_content")
-        #prompt_new = st.button("New", on_click = _prompt(prompt_title, prompt))
-        #prompt_delete = st.button("Del", on_click = utils.del_prompt(prompt_title_editable))
-        #prompt_save = st.button("Save", on_click = utils.save_prompt(prompt_title_editable, prompt))
-        #scrape_boost = st.number_input('Web to API content ratio', value=1.)
-        top_k = st.number_input('# Top Results', value=20)
-        is_debug = st.checkbox("Debug output", value = False, key="debug")
-        openai_model = st.selectbox(label="Model", options=["gpt-4-1106-preview", "gpt-3.5-turbo-16k-0613", "gpt-3.5-turbo-16k"], index=0, key="openai_model")
-        index_namespace = st.selectbox(label="Data Type", options=["websummarized", "web", "cbli", "all"], index=0)
-        liked_companies = st.text_input(label="liked companies", key='liked_companies')
-        disliked_companies = st.text_input(label="disliked companies", key='disliked_companies')
     with tab_search:
@@ -423,10 +412,31 @@ if utils.check_password():
         #cluster = st.checkbox("Cluster the results", value = False, key = "cluster")
         #prompt_new = st.button("New", on_click = _prompt(prompt_title, prompt))
     if not "assistant_thread" in st.session_state:
         st.session_state.assistant_thread = st.session_state.openai_client.beta.threads.create()
-    if query != "":
         # if report_type=="standard":
         #     prompt = default_prompt
         # elif report_type=="clustered":
@@ -443,5 +453,8 @@ if utils.check_password():
         st.session_state.index_namespace = index_namespace
         st.session_state.region = region_selectbox
         st.session_state.country = countries_selectbox
         run_query(query, report_type, top_k, region_selectbox, countries_selectbox, is_debug, index_namespace, openai_model)

 import json
 from langchain.chains import RetrievalQA
 from langchain.embeddings.openai import OpenAIEmbeddings
 from langchain.prompts import PromptTemplate
 from langchain.vectorstores import Pinecone
 import pandas as pd
+from PIL import Image
 from streamlit.runtime.state import session_state
 import openai
 import streamlit as st
 st.session_state.index = utils.init_pinecone()
 st.session_state.db_search_results = []
+#st.image("resources/raized_logo.png")
+assistant_avatar = Image.open('resources/raized_logo.png')
 carddict = {
         "name": [],
         "company_id": [],
     retriever = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
     #reader = pipeline(tokenizer=model_name, model=model_name, task='question-answering')
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     return retriever, tokenizer#, vectorstore
+@st.cache_resource
+def init_openai():
+    assistants = st.session_state.openai_client.beta.assistants.list(
+        order="desc",
+        limit="20",
+    )
+    return assistants
+assistants = init_openai()
 st.session_state.openai_client = oai.get_client()
 retriever, tokenizer = init_models()
 st.session_state.retriever = retriever
             with content_container:
                 for message in list(messages)[::-1]:
                     if hasattr(message, 'role'):
+                        # print(f"\n-----\nMessage: {message}\n")
+                        # with st.chat_message(name = message.role):
+                        #     st.write(message.content[0].text.value)
+                        if message.role == "assistant":
+                             with st.chat_message(name = message.role, avatar = assistant_avatar):
+                                st.write(message.content[0].text.value)
+                        else:
+                            with st.chat_message(name = message.role):
+                                st.write(message.content[0].text.value)
         # st.session_state.messages.append({"role": "user", "content": query})
         # st.session_state.messages.append({"role": "system", "content": m_text})
                 use_container_width=True)
+def query_sent():
+    st.session_state.user_query = ""
 def render_history():
     with st.session_state.history_container:
     if st.sidebar.button("New Conversation") or "messages" not in st.session_state:
         st.session_state.assistant_thread = st.session_state.openai_client.beta.threads.create()
         st.session_state.new_conversation = True
+        st.session_state.messages = []
     st.markdown("<h1 style='text-align: center; color: red; position: relative; top: -3rem;'>Raized.AI – Startups discovery demo</h1>", unsafe_allow_html=True)
         unsafe_allow_html=True
     )
+    #tab_search, tab_advanced = st.tabs(["Search", "Settings"])
+    tab_search = st.container()
     with tab_search:
         #cluster = st.checkbox("Cluster the results", value = False, key = "cluster")
         #prompt_new = st.button("New", on_click = _prompt(prompt_title, prompt))
+    tab_advanced = st.sidebar.expander("Settings")
+    with tab_advanced:
+        #prompt_title = st.selectbox("Report Type", index = 0, options = utils.get_prompts(), on_change=on_prompt_selected, key="advanced_prompts_select", )
+        #prompt_title_editable = st.text_input("Title", key="prompt_title_editable")
+        report_type = st.selectbox(label="Response Type", options=["assistant", "standard", "guided", "company_list", "clustered"], index=0)
+        #assistant_id = st.text_input(label="Assistant ID", key="assistant_id", value = "asst_NHoxEosVlemDY7y5TYg8ftku") #value="asst_fkZtxo127nxKOCcwrwznuCs2")
+        assistant_id = st.selectbox(label="Assistant", options = [f"{a.id}|||{a.name}" for a in assistants])
+        default_prompt = st.text_area("Default Prompt", value = utils.default_prompt, height=400, key="advanced_default_prompt_content")
+        clustering_prompt = st.text_area("Clustering Prompt", value = utils.clustering_prompt, height=400, key="advanced_clustering_prompt_content")
+        #prompt_new = st.button("New", on_click = _prompt(prompt_title, prompt))
+        #prompt_delete = st.button("Del", on_click = utils.del_prompt(prompt_title_editable))
+        #prompt_save = st.button("Save", on_click = utils.save_prompt(prompt_title_editable, prompt))
+        #scrape_boost = st.number_input('Web to API content ratio', value=1.)
+        top_k = st.number_input('# Top Results', value=20)
+        is_debug = st.checkbox("Debug output", value = False, key="debug")
+        openai_model = st.selectbox(label="Model", options=["gpt-4-1106-preview", "gpt-3.5-turbo-16k-0613", "gpt-3.5-turbo-16k"], index=0, key="openai_model")
+        index_namespace = st.selectbox(label="Data Type", options=["websummarized", "web", "cbli", "all"], index=0)
+        liked_companies = st.text_input(label="liked companies", key='liked_companies')
+        disliked_companies = st.text_input(label="disliked companies", key='disliked_companies')
     if not "assistant_thread" in st.session_state:
         st.session_state.assistant_thread = st.session_state.openai_client.beta.threads.create()
+    if query != "" and not st.session_state.new_conversation:
         # if report_type=="standard":
         #     prompt = default_prompt
         # elif report_type=="clustered":
         st.session_state.index_namespace = index_namespace
         st.session_state.region = region_selectbox
         st.session_state.country = countries_selectbox
+        #st.session_state.user_query = ''
         run_query(query, report_type, top_k, region_selectbox, countries_selectbox, is_debug, index_namespace, openai_model)
+    else:
+        st.session_state.new_conversation = False