Spaces:

FelipeMena
/

BiblioBot

Sleeping

App Files Files Community

FelipeMena commited on Jun 9

Commit

94817a4

verified ·

1 Parent(s): 2600dd7

Arreglos en la documentacion

Browse files

Files changed (1) hide show

app.py +23 -10

app.py CHANGED Viewed

@@ -3,6 +3,13 @@ from transformers import pipeline
 from sentence_transformers import SentenceTransformer
 import faiss
 import numpy as np
 # --- Base documental: información sobre la biblioteca ---
 documentos = [
@@ -30,6 +37,9 @@ documentos = [
     "¿Que categorías de libros hay? La biblioteca cuenta con libros de texto, literatura, investigación, tecnología, humanidades, y más."
 ]
 # --- Preguntas frecuentes personalizadas ---
 # --- Son preguntas que se hacen sin signos de pregunta o con signos incompletos ---
 faq_personalizadas = {
@@ -42,9 +52,12 @@ faq_personalizadas = {
     "que categoria de libros hay?": "Hay libros de ciencia, literatura, ingeniería, arte, historia, tecnología y muchos más."
 }
 # --- Cargar modelo de embeddings y crear índice FAISS ---
 modelo_emb = SentenceTransformer('sentence-transformers/bert-base-nli-mean-tokens')
-embeddings_docs = modelo_emb.encode(documentos, convert_to_numpy=True)
 dim = embeddings_docs.shape[1]
 index = faiss.IndexFlatL2(dim)
@@ -55,7 +68,7 @@ qa_pipeline = pipeline("question-answering", model="PlanTL-GOB-ES/roberta-base-b
 # --- Detectar saludos y frases comunes ---
 def respuesta_basica(texto):
-    texto = texto.lower().strip()
     saludos = ["hola", "buenos días", "buenas tardes", "buenas noches", "qué tal", "hey", "buen día"]
     despedidas = ["adiós", "hasta luego", "nos vemos"]
     agradecimientos = ["gracias", "muchas gracias", "te lo agradezco"]
@@ -71,20 +84,20 @@ def respuesta_basica(texto):
 # --- Función de chatbot con manejo de frases comunes ---
 def chat_biblioteca(mensaje, historial=None):
-    mensaje_limpio = mensaje.lower().strip()
     respuesta_simple = respuesta_basica(mensaje)
     if respuesta_simple:
         return respuesta_simple
-    for clave in faq_personalizadas:
-        if clave in mensaje_limpio:
-            return faq_personalizadas[clave]
     # Respuesta con embeddings y QA
-    embedding = modelo_emb.encode([mensaje], convert_to_numpy=True)
-    D, I = index.search(embedding, k=2)
-    contexto = " ".join([documentos[i] for i in I[0]])
     try:
         resultado = qa_pipeline(question=mensaje, context=contexto)

 from sentence_transformers import SentenceTransformer
 import faiss
 import numpy as np
+import unicodedata
+# --- Normalización de texto (quita tildes y pasa a minúsculas) ---
+def normalizar(texto):
+    texto = texto.lower().strip()
+    texto = unicodedata.normalize("NFD", texto).encode("ascii", "ignore").decode("utf-8")
+    return texto
 # --- Base documental: información sobre la biblioteca ---
 documentos = [
     "¿Que categorías de libros hay? La biblioteca cuenta con libros de texto, literatura, investigación, tecnología, humanidades, y más."
 ]
+# Normalizar documentos
+documentos_normalizados = [normalizar(doc) for doc in documentos]
 # --- Preguntas frecuentes personalizadas ---
 # --- Son preguntas que se hacen sin signos de pregunta o con signos incompletos ---
 faq_personalizadas = {
     "que categoria de libros hay?": "Hay libros de ciencia, literatura, ingeniería, arte, historia, tecnología y muchos más."
 }
+# Normalizar claves de faq_personalizadas
+faq_personalizadas_normalizadas = {normalizar(k): v for k, v in faq_personalizadas.items()}
 # --- Cargar modelo de embeddings y crear índice FAISS ---
 modelo_emb = SentenceTransformer('sentence-transformers/bert-base-nli-mean-tokens')
+embeddings_docs = modelo_emb.encode(documentos_normalizados, convert_to_numpy=True)
 dim = embeddings_docs.shape[1]
 index = faiss.IndexFlatL2(dim)
 # --- Detectar saludos y frases comunes ---
 def respuesta_basica(texto):
+    texto = normalizar(texto)
     saludos = ["hola", "buenos días", "buenas tardes", "buenas noches", "qué tal", "hey", "buen día"]
     despedidas = ["adiós", "hasta luego", "nos vemos"]
     agradecimientos = ["gracias", "muchas gracias", "te lo agradezco"]
 # --- Función de chatbot con manejo de frases comunes ---
 def chat_biblioteca(mensaje, historial=None):
+    mensaje_normal = normalizar(mensaje)
     respuesta_simple = respuesta_basica(mensaje)
     if respuesta_simple:
         return respuesta_simple
+    for clave in faq_personalizadas_normalizadas:
+        if clave in mensaje_normal:
+            return faq_personalizadas_normalizadas[clave]
     # Respuesta con embeddings y QA
+    embedding = modelo_emb.encode([mensaje_normal], convert_to_numpy=True)
+    D, I = index.search(embedding, k=5)
+    contexto = " ".join([documentos_normalizados[i] for i in I[0]])
     try:
         resultado = qa_pipeline(question=mensaje, context=contexto)