Spaces:

JeanCGuerrero
/

Question_Answering_Nutrition

Running

App Files Files Community

JeanCGuerrero commited on Apr 17

Commit

5d4742e

verified ·

1 Parent(s): 75f4cb1

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -18

app.py CHANGED Viewed

@@ -1,31 +1,31 @@
 import os
-import subprocess
 import gradio as gr
 from langchain.text_splitter import RecursiveCharacterTextSplitter
-from langchain_community.document_loaders import WebBaseLoader
 from langchain_community.vectorstores import Chroma
 from langchain_huggingface import HuggingFaceEmbeddings
-from langchain.document_loaders import PyPDFLoader
 import requests
 from rerankers import Reranker
-from langchain_community.chat_models import ChatOllama
 from langchain import hub
 from langchain_core.output_parsers import StrOutputParser
-# Paso 1: Instalar ollama
-subprocess.run("curl -fsSL https://ollama.com/install.sh | sh", shell=True, check=True)
-subprocess.run("ollama serve &", shell=True, check=True)
-subprocess.run("ollama pull llama3.2:1b", shell=True, check=True)
-# Paso 2: Descargar el documento PDF
 URL = "https://gruposdetrabajo.sefh.es/gefp/images/stories/documentos/4-ATENCION-FARMACEUTICA/Nutricion/Manual_basico_N_clinica_y_Dietetica_Valencia_2012.pdf"
 response = requests.get(URL)
 with open("Manual_de_nutrición_clinica.pdf", "wb") as f:
     f.write(response.content)
-# Paso 3: Inicializar el modelo y los embeddings
-local_llm = "llama3.2:1b"
-llm = ChatOllama(model=local_llm, temperature=0, top_k=50, top_p=0.95)
 chain = llm | StrOutputParser()
 # Cargar y procesar el PDF
@@ -42,7 +42,7 @@ vectordb = Chroma.from_documents(documents=all_splits, embedding=embeddings, per
 # Inicializar el reranker
 ranker = Reranker("answerdotai/answerai-colbert-small-v1", model_type='colbert')
-# Paso 4: Definir la función RAG con reranking
 def format_docs(docs):
     return "\n\n".join(doc[0].page_content for doc in docs)
@@ -56,17 +56,14 @@ def test_rag_reranking(query, ranker):
             doc_details = doc.to_json()['kwargs']
             context.append(doc_details['page_content'])
     if len(context) > 0:
-        # Aplicar reranking
         ranking = ranker.rank(query=query, docs=context)
-        # Tomar el contexto más relevante
         useful_context = ranking[0].text
-        # Generar la respuesta
         generation = rag_chain.invoke({"context": useful_context, "question": query})
         return generation
     else:
         return "No tengo información para responder a esta pregunta"
-# Paso 5: Crear una interfaz con Gradio
 def answer_query(query):
     return test_rag_reranking(query, ranker)
@@ -80,4 +77,3 @@ interface = gr.Interface(
 # Lanzar la interfaz
 interface.launch()

 import os
 import gradio as gr
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_community.vectorstores import Chroma
 from langchain_huggingface import HuggingFaceEmbeddings
+from langchain_community.document_loaders import PyPDFLoader
 import requests
 from rerankers import Reranker
+from langchain_huggingface import HuggingFacePipeline
 from langchain import hub
 from langchain_core.output_parsers import StrOutputParser
+# Configurar USER_AGENT
+os.environ["USER_AGENT"] = "MyHFSpace/1.0 (HuggingFace Space for Nutrition Q&A)"
+# Paso 1: Descargar el documento PDF
 URL = "https://gruposdetrabajo.sefh.es/gefp/images/stories/documentos/4-ATENCION-FARMACEUTICA/Nutricion/Manual_basico_N_clinica_y_Dietetica_Valencia_2012.pdf"
 response = requests.get(URL)
 with open("Manual_de_nutrición_clinica.pdf", "wb") as f:
     f.write(response.content)
+# Paso 2: Inicializar el modelo usando Hugging Face Pipeline
+# Nota: Si no tienes acceso a llama3.2:1b, reemplázalo por otro modelo de HF, como "distilbert-base-uncased"
+llm = HuggingFacePipeline.from_model_id(
+    model_id="distilbert-base-uncased",  # Cambia por el modelo al que tengas acceso
+    task="text-generation",
+    pipeline_kwargs={"temperature": 0, "top_k": 50, "top_p": 0.95, "max_length": 512}
+)
 chain = llm | StrOutputParser()
 # Cargar y procesar el PDF
 # Inicializar el reranker
 ranker = Reranker("answerdotai/answerai-colbert-small-v1", model_type='colbert')
+# Paso 3: Definir la función RAG con reranking
 def format_docs(docs):
     return "\n\n".join(doc[0].page_content for doc in docs)
             doc_details = doc.to_json()['kwargs']
             context.append(doc_details['page_content'])
     if len(context) > 0:
         ranking = ranker.rank(query=query, docs=context)
         useful_context = ranking[0].text
         generation = rag_chain.invoke({"context": useful_context, "question": query})
         return generation
     else:
         return "No tengo información para responder a esta pregunta"
+# Paso 4: Crear una interfaz con Gradio
 def answer_query(query):
     return test_rag_reranking(query, ranker)
 # Lanzar la interfaz
 interface.launch()