IT2091024v2

Paused

Pijush2023 commited on Aug 26, 2024

Commit

8a9de56

verified ·

1 Parent(s): 2fbb8d5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -360,8 +360,14 @@ def generate_answer(message, choice, retrieval_mode, selected_model):
         prompt_template = QA_CHAIN_PROMPT_1 if choice == "Details" else QA_CHAIN_PROMPT_2
         if retrieval_mode == "VDB":
             if selected_model == chat_model:
-                # Use Langchain with GPT-4o
                 qa_chain = RetrievalQA.from_chain_type(
                     llm=chat_model,
                     chain_type="stuff",
@@ -370,15 +376,17 @@ def generate_answer(message, choice, retrieval_mode, selected_model):
                 )
                 response = qa_chain({"query": message})
                 return response['result'], extract_addresses(response['result'])
             elif selected_model == phi_pipe:
-                # Directly use the Phi-3.5 model for text generation
-                response = selected_model(message, **{
-                    "max_new_tokens": 500,
                     "return_full_text": False,
-                    "temperature": 0.0,
-                    "do_sample": False,
                 })[0]['generated_text']
                 return response, extract_addresses(response)
         elif retrieval_mode == "KGF":
             response = chain_neo4j.invoke({"question": message})
             return response, extract_addresses(response)

         prompt_template = QA_CHAIN_PROMPT_1 if choice == "Details" else QA_CHAIN_PROMPT_2
         if retrieval_mode == "VDB":
+            # Retrieve context from the vector database
+            context = retriever.get_relevant_documents(message)
+            # Format the prompt
+            prompt = prompt_template.format(context=context, question=message)
             if selected_model == chat_model:
+                # Use GPT-4o with Langchain
                 qa_chain = RetrievalQA.from_chain_type(
                     llm=chat_model,
                     chain_type="stuff",
                 )
                 response = qa_chain({"query": message})
                 return response['result'], extract_addresses(response['result'])
             elif selected_model == phi_pipe:
+                # Use Phi-3.5 directly with the formatted prompt
+                response = selected_model(prompt, **{
+                    "max_new_tokens": 300,  # Limit the tokens for faster generation
                     "return_full_text": False,
+                    "temperature": 0.5,  # Adjust temperature for more consistent answers
+                    "do_sample": True,
                 })[0]['generated_text']
                 return response, extract_addresses(response)
         elif retrieval_mode == "KGF":
             response = chain_neo4j.invoke({"question": message})
             return response, extract_addresses(response)