Spaces:

enricorampazzo
/

DAMHelper

Sleeping

App Files Files Community

enricorampazzo commited on Sep 13, 2024

Commit

224e4de

1 Parent(s): d005419

streamlit ui and ondemand integration

Browse files

Files changed (8) hide show

app.py +80 -3
prompts/prompts_manager.py +1 -1
repository/intel_npu.py +1 -1
repository/ondemand.py +39 -0
repository/repository.py +20 -1
repository/repository_abc.py +1 -1
repository/testing_repo.py +31 -0
utils/parsing_utils.py +3 -0

app.py CHANGED Viewed

@@ -1,3 +1,5 @@
 from pathlib import Path
 from llm_manager.llm_parser import LlmParser
@@ -7,6 +9,9 @@ from repository.repository import get_repository
 from repository.repository_abc import ModelRoles, Model
 from form.form import build_form_data_from_answers, write_pdf_form
 def check_for_missing_answers(parsed_questions: dict[int, str]):
     return [k for k in parsed_questions if parsed_questions[k] is None]
@@ -18,10 +23,9 @@ def ask_again(missing_questions: list[int], user_questions: list[str], parsed_qu
         parsed_questions[id_] = new_answer
-if __name__ == '__main__':
     prompts_manager = PromptsManager()
-    user_prompt = input(f"Please describe what you need to do. To get the best results "
-                        f"try to answer all the following questions:\n{'\n'.join(prompts_manager.questions)}\n\n>")
     repository = get_repository("intel_npu", Model("meta-llama/Meta-Llama-3-8B-Instruct",
                                                    ModelRoles("system", "user", "assistant")),
@@ -40,3 +44,76 @@ if __name__ == '__main__':
     form_data = build_form_data_from_answers(answers, categories, f"{Path(__file__, "..", "signature.png")}")
     write_pdf_form(form_data, Path("signed_form1.pdf"))

+import os
+import uuid
 from pathlib import Path
 from llm_manager.llm_parser import LlmParser
 from repository.repository_abc import ModelRoles, Model
 from form.form import build_form_data_from_answers, write_pdf_form
+import streamlit as st
+user_msg = "Please describe what you need to do. To get the best results try to answer all the following questions:"
 def check_for_missing_answers(parsed_questions: dict[int, str]):
     return [k for k in parsed_questions if parsed_questions[k] is None]
         parsed_questions[id_] = new_answer
+def use_command_line():
     prompts_manager = PromptsManager()
+    user_prompt = input(f"{user_msg}\n{'\n'.join(prompts_manager.questions)}\n\n>")
     repository = get_repository("intel_npu", Model("meta-llama/Meta-Llama-3-8B-Instruct",
                                                    ModelRoles("system", "user", "assistant")),
     form_data = build_form_data_from_answers(answers, categories, f"{Path(__file__, "..", "signature.png")}")
     write_pdf_form(form_data, Path("signed_form1.pdf"))
+def update_answer (answers, missing_answer):
+    answers[missing_answer] = getattr(st.session_state, f"ma_{missing_answer}")
+def use_streamlit():
+    pm = PromptsManager()
+    help_ = f"{user_msg}\n\n{'\n'.join(pm.questions)}"
+    repository = get_repository("ondemand", Model("ondemand-gpt-3.5-turbo", ModelRoles("system", "user", "assistant")))
+    if not st.session_state.get("step"):
+        with st.form("Please describe your request"):
+            user_input = st.text_area("Your input", height=700, label_visibility="hidden", placeholder=help_, help=help_)
+            signature = st.file_uploader("Your signature", key="file_upload")
+            st.session_state["signature"] = signature
+            st.session_state["session_id"] = str(uuid.uuid4())
+            button = st.form_submit_button()
+        if button:
+            llama3 = "meta-llama/Meta-Llama-3-8B-Instruct"
+            # repository = get_repository("intel_npu", Model(llama3,
+            #                                                ModelRoles("system", "user", "assistant")),
+            #                             pm.system_prompt, Path("llm_log.txt"))
+            st.session_state["step"] = "parsing_answers"
+    if st.session_state.get("step") == "parsing_answers":
+        with st.status("initialising LLM"):
+            repository.init()
+        with st.status("waiting for LLM"):
+            repository.send_prompt(pm.ingest_user_answers(user_input))
+            answer = repository.send_prompt(pm.verify_user_input_prompt(user_input))
+        with st.status("Checking for missing answers"):
+            st.session_state["answers"] = LlmParser.parse_verification_prompt_answers(answer['content'])
+        st.session_state["missing_answers"] = check_for_missing_answers(st.session_state["answers"])
+        if not st.session_state.get("missing_answers"):
+            st.session_state["step"] = "check_category"
+        else:
+            st.session_state["step"] = "ask_again"
+    if st.session_state.get("step") == "ask_again":
+        with st.form("form1"):
+            for ma in st.session_state["missing_answers"]:
+                st.text_input(pm.questions[ma].lower(), key=ma)
+            submitted = st.form_submit_button("Submit answers")
+            if submitted:
+                st.session_state["step"] = "check_category"
+                for ma in st.session_state["missing_answers"]:
+                    st.session_state["answers"][ma] = st.session_state[ma]
+    if st.session_state.get("step") == "check_category":
+        with st.status("finding the work categories applicable to your work"):
+            answer = repository.send_prompt(pm.get_work_category(st.session_state["answers"][1]))
+            categories = LlmParser.parse_get_categories_answer(answer['content'])
+        with st.status("categories found, creating PDF form"):
+            form_filename = f"{st.session_state["session_id"]}_form.pdf"
+            st.session_state["form_filename"] = form_filename
+            form_data = build_form_data_from_answers(st.session_state["answers"], categories,
+                                                     st.session_state.get("signature"))
+            write_pdf_form(form_data, Path(form_filename))
+            st.session_state["step"] = "form_created"
+    if st.session_state.get("step") == "form_created":
+        with open(Path(st.session_state["form_filename"]), "rb") as form:
+            st.download_button("download form", form.read(), mime="application/pdf")
+        start_over_button = st.button("Start over")
+        if start_over_button:
+            del st.session_state["step"]
+            os.unlink(st.session_state["form_filename"])
+use_streamlit()
+#use_command_line()

prompts/prompts_manager.py CHANGED Viewed

@@ -22,7 +22,7 @@ class PromptsManager:
             self.verification_prompt: str = verification_prompt
     def verify_user_input_prompt(self, user_prompt) -> str:
-        return (f"Using only this information \n {user_prompt} \n Answer the following questions, if the answer is not present just answer null. "
                 f"Put each answer in a new line, keep the answer brief "
                 f"and maintain the order in which the questions are asked. Do not add any preamble: "
                 f"{self.verification_prompt}")

             self.verification_prompt: str = verification_prompt
     def verify_user_input_prompt(self, user_prompt) -> str:
+        return (f"Using only this information \n {user_prompt} \n answer the following questions, if the answer is not present or you are not sure about the answer just answer null. "
                 f"Put each answer in a new line, keep the answer brief "
                 f"and maintain the order in which the questions are asked. Do not add any preamble: "
                 f"{self.verification_prompt}")

repository/intel_npu.py CHANGED Viewed

@@ -42,7 +42,7 @@ class IntelNpuRepository(Repository):
         input_ids = (self.tokenizer.apply_chat_template(self.get_message_history(), add_generation_prompt=True,
                                                         return_tensors="pt")
                      .to(self.model.device))
-        outputs = self.model.generate(input_ids, eos_token_id=self.terminators, do_sample=True, max_new_tokens=2000)
         generated_token_array = outputs[0][len(input_ids[0]):]
         generated_tokens = "".join(self.tokenizer.batch_decode(generated_token_array, skip_special_tokens=True))
         answer = {"role": self.get_model_info().roles.ai_role, "content": generated_tokens}

         input_ids = (self.tokenizer.apply_chat_template(self.get_message_history(), add_generation_prompt=True,
                                                         return_tensors="pt")
                      .to(self.model.device))
+        outputs = self.model.generate(input_ids, eos_token_id=self.terminators, do_sample=True, max_new_tokens=2000, cache_position=None)
         generated_token_array = outputs[0][len(input_ids[0]):]
         generated_tokens = "".join(self.tokenizer.batch_decode(generated_token_array, skip_special_tokens=True))
         answer = {"role": self.get_model_info().roles.ai_role, "content": generated_tokens}

repository/ondemand.py ADDED Viewed

	@@ -0,0 +1,39 @@

+import os
+from pathlib import Path
+import requests
+from repository.repository_abc import Repository, Model, ModelRoles
+class OndemandRepository(Repository):
+    session_url = "https://api.on-demand.io/chat/v1/sessions"
+    def __init__(self, model_info: Model, system_message: str = None, log_to_file:Path=None):
+        self.model_info = model_info
+        self.system_message = system_message
+        self.log_to_file = log_to_file
+        self.session_id = None
+    def init(self):
+        if not self.session_id:
+            headers = {"apiKey": os.getenv("API_KEY")}
+            session_body = {"pluginIds": [], "externalUserId": "virtualDAM"}
+            response = requests.post(self.session_url, headers=headers, json=session_body)
+            response_data = response.json()
+            self.session_id = response_data["data"]["id"]
+    def get_model_roles(self) -> ModelRoles:
+        return self.model_info.roles
+    def get_model_info(self) -> Model:
+        return self.model_info
+    def send_prompt(self, prompt: str, add_to_history: bool = None) -> dict[str, str]:
+        headers = {"apiKey": os.getenv("API_KEY")}
+        body = {'endpointId': 'predefined-openai-gpt3.5turbo', 'query': prompt, 'pluginIds': [], 'responseMode': 'sync'}
+        url = f'https://api.on-demand.io/chat/v1/sessions/{self.session_id}/query'
+        response = requests.post(url, headers=headers, json=body)
+        return {"content": response.json()["data"]["answer"]}
+    def get_message_history(self) -> list[dict[str, str]]:
+        return []

repository/repository.py CHANGED Viewed

@@ -2,14 +2,33 @@ from pathlib import Path
 from repository.intel_npu import IntelNpuRepository
 from repository.ollama import OllamaRepository
 from repository.repository_abc import Model
 def get_repository(implementation: str, model: Model, system_msg: str = None, log_to_file: Path = None):
     known_implementations = ["ollama", "intel_npu"]
-    if not implementation or implementation.lower() not in ["ollama", "intel_npu"]:
         raise ValueError(f"Unknown implementation {implementation}. Known implementations: {known_implementations}")
     if "ollama" == implementation:
         return OllamaRepository(model, system_msg)
     if "intel_npu" == implementation:
         return IntelNpuRepository(model, system_msg, log_to_file)

 from repository.intel_npu import IntelNpuRepository
 from repository.ollama import OllamaRepository
+from repository.ondemand import OndemandRepository
 from repository.repository_abc import Model
+from repository.testing_repo import TestingRepository
 def get_repository(implementation: str, model: Model, system_msg: str = None, log_to_file: Path = None):
     known_implementations = ["ollama", "intel_npu"]
+    if not implementation or implementation.lower() not in ["ollama", "intel_npu", "testing", "ondemand"]:
         raise ValueError(f"Unknown implementation {implementation}. Known implementations: {known_implementations}")
     if "ollama" == implementation:
         return OllamaRepository(model, system_msg)
     if "intel_npu" == implementation:
         return IntelNpuRepository(model, system_msg, log_to_file)
+    if "ondemand" == implementation:
+        return OndemandRepository(model, system_msg, log_to_file)
+    if "testing" == implementation:
+        return TestingRepository(prompts_answers=[
+            {
+                "role": "assistant",
+                "content": "OK"
+            },
+            {
+                "role": "assistant",
+                "content": "What is my full name?\n\nnull\n\nWhat is the nature of the work I need to do?\n\nPest control\n\nIn which community is the work taking place?\n\nJBR\n\nIn which building?\n\nnull\n\nIn which unit/apartment number?\n\nnull\n\nAm I the owner or the tenant?\n\nTenant\n\nIn which date is the work taking place?\n\n12/09/2024\n\nIn which date will the work finish?\n\n12/09/2024\n\nWhat is my contact number?\n\nnull\n\nWhat is the name of the contracting company?\n\nnull\n\nWhat is the contact number of the contracting company?\n\nnull\n\nWhat is the email of the contracting company?\n\nnull\n\nWhat is my email?\n\nnull"
+            },
+            {
+                "role":"assistant",
+                "content":"pest_control"
+            }
+        ])

repository/repository_abc.py CHANGED Viewed

@@ -28,7 +28,7 @@ class Repository(abc.ABC):
     def send_prompt(self, prompt: str, add_to_history: bool) -> dict[str, str]:
         pass
-    def set_message_for_role(self, message: str, role: str):
         self.get_message_history().append({"role": role, "content": message})
     def init(self):

     def send_prompt(self, prompt: str, add_to_history: bool) -> dict[str, str]:
         pass
+    def set_message_for_role(self, role: str, message: str):
         self.get_message_history().append({"role": role, "content": message})
     def init(self):

repository/testing_repo.py ADDED Viewed

	@@ -0,0 +1,31 @@

+from typing import Tuple
+from repository.repository_abc import Repository, Model, ModelRoles
+class TestingRepository(Repository):
+    def __init__(self, prompts_answers: list[dict[str, str]], model_info:Model=None):
+        self.prompt_answers = prompts_answers
+        self.next_answer = iter(self.prompt_answers)
+        self.message_history = []
+        self.model_info = model_info or Model("fake_model",
+                                              ModelRoles("system", "user", "assistant"))
+    def init(self):
+        pass
+    def send_prompt(self, prompt: str, add_to_history: bool = True) -> dict[str, str]:
+        response = next(self.next_answer)
+        if add_to_history:
+            self.get_message_history().append(response)
+        return response
+    def get_message_history(self) -> list[dict[str, str]]:
+        return self.message_history
+    def get_model_info(self) -> Model:
+        return self.model_info
+    def get_model_roles(self) -> ModelRoles:
+        return self.model_info.roles

utils/parsing_utils.py CHANGED Viewed

@@ -15,3 +15,6 @@ def find_and_parse_date(llm_answer: str) -> str | None:
 def find_and_parse_phone_number(llm_answer: str):
     return _find_and_parse(llm_answer, parse_phone_number_regex)

 def find_and_parse_phone_number(llm_answer: str):
     return _find_and_parse(llm_answer, parse_phone_number_regex)
+def check_for_missing_answers(parsed_questions: dict[int, str]):
+    return [k for k in parsed_questions if parsed_questions[k] is None]