Spaces:

Programmes
/

Edu_Pilot_g

Build error

App Files Files Community

Programmes commited on Mar 31

Commit

ff6c924

verified ·

1 Parent(s): 48391f9

Upload 4 files

Browse files

Files changed (4) hide show

README.md +7 -13
app.py +13 -19
rag_utils.py +21 -41
requirements.txt +4 -3

README.md CHANGED Viewed

@@ -1,16 +1,10 @@
----
-title: EduPilot
-emoji: 🎓
-colorFrom: blue
-colorTo: yellow
-sdk: gradio
-sdk_version: "4.20.0"
-app_file: app.py
-pinned: false
----
-# EduPilot – Chatbot d’Orientation IA
-Bienvenue ! Ce chatbot est un conseiller d'orientation IA intelligent, entraîné à répondre aux questions sur les études, les filières, et les métiers.
-Pose-lui toutes tes questions sur ton avenir scolaire 🤖🎓

+# EduPilot – Chatbot IA d'Orientation
+EduPilot est un chatbot éducatif qui répond à tes questions sur les formations, les écoles et les métiers.
+💡 Fonctionne avec un moteur RAG (Retrieval Augmented Generation) et peut utiliser :
+- `Mistral-7B` (si token fourni dans les secrets)
+- Sinon, un modèle public comme `FLAN-T5`.
+## Exemple de question :
+> Quelle formation pour devenir psychologue ?

app.py CHANGED Viewed

@@ -1,37 +1,31 @@
 import gradio as gr
 from rag_utils import load_faiss_index, get_embedding_model, query_index, nettoyer_context, generate_answer
-# Chargement des données
 index, documents = load_faiss_index()
 embedder = get_embedding_model()
-# Fonction pour traiter la question et générer une réponse
 def respond(message, history):
         context = query_index(message, index, documents, embedder)
         cleaned_context = nettoyer_context("\n".join(context))
         answer = generate_answer(message, cleaned_context)
-        history.append((message, answer))
-        return "", history
-# Interface Gradio
 with gr.Blocks(theme=gr.themes.Soft(primary_hue="blue", secondary_hue="yellow")) as demo:
-    gr.Markdown("# 🎓 EduPilot - Chatbot d'Orientation IA")
-    gr.Markdown("👋 Bonjour ! Je suis **EduPilot**, ton conseiller IA.\n\nPose-moi une question sur ton avenir scolaire, les filières, les écoles ou les métiers qui t'intéressent.")
     chatbot = gr.Chatbot(label="Conseiller IA")
-    state = gr.State([])  # historique du chat
     with gr.Row():
-        msg = gr.Textbox(
-            placeholder="Exemple : Comment devenir médecin ?",
-            show_label=False,
-            container=True,
-            scale=8
-        )
-        submit = gr.Button("Envoyer", scale=1)
-    submit.click(respond, [msg, state], [msg, chatbot, state])
     msg.submit(respond, [msg, state], [msg, chatbot, state])
-demo.launch()

 import gradio as gr
 from rag_utils import load_faiss_index, get_embedding_model, query_index, nettoyer_context, generate_answer
 index, documents = load_faiss_index()
 embedder = get_embedding_model()
 def respond(message, history):
+    try:
         context = query_index(message, index, documents, embedder)
         cleaned_context = nettoyer_context("\n".join(context))
         answer = generate_answer(message, cleaned_context)
+    except Exception as e:
+        answer = f"❌ Erreur : {str(e)}"
+    history.append((message, answer))
+    return "", history
 with gr.Blocks(theme=gr.themes.Soft(primary_hue="blue", secondary_hue="yellow")) as demo:
+    gr.Markdown("# 🎓 EduPilot – Chatbot d'Orientation IA")
+    gr.Markdown("👋 Bienvenue ! Je suis **EduPilot**, ton conseiller scolaire IA. Pose-moi une question sur les métiers ou les formations.")
     chatbot = gr.Chatbot(label="Conseiller IA")
+    state = gr.State([])
     with gr.Row():
+        msg = gr.Textbox(placeholder="Exemple : Comment devenir vétérinaire ?", show_label=False, scale=8)
+        btn = gr.Button("Envoyer", scale=1)
+    btn.click(respond, [msg, state], [msg, chatbot, state])
     msg.submit(respond, [msg, state], [msg, chatbot, state])
+demo.launch()

rag_utils.py CHANGED Viewed

@@ -1,18 +1,25 @@
 import faiss
 import pickle
 import numpy as np
 import re
 from sentence_transformers import SentenceTransformer
-from transformers import AutoTokenizer  # Ajouté pour la gestion des tokens
 from huggingface_hub import InferenceClient
-import os
-# Chargement du modèle
-client = InferenceClient("mistralai/Mistral-7B-Instruct-v0.1", token=os.environ.get("edup2"))
-# Chargement du tokenizer
-tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-Instruct-v0.1", token=os.environ.get("edup2"))
 def load_faiss_index(index_path="faiss_index/faiss_index.faiss", doc_path="faiss_index/documents.pkl"):
     index = faiss.read_index(index_path)
@@ -34,12 +41,7 @@ def nettoyer_context(context):
     return context
 def generate_answer(question, context):
-    MAX_TOKENS_TOTAL = 2048
-    MAX_NEW_TOKENS = 300
-    MAX_PROMPT_TOKENS = MAX_TOKENS_TOTAL - MAX_NEW_TOKENS
-    # Construction initiale du prompt
-    base_prompt = f"""Voici des informations sur des établissements et formations :
 {context}
@@ -48,31 +50,9 @@ Formule ta réponse comme un conseiller d’orientation bienveillant, de manièr
 Question : {question}
 Réponse :"""
-    # Tronquer si le prompt est trop long
-    tokens = tokenizer.encode(base_prompt)
-    if len(tokens) > MAX_PROMPT_TOKENS:
-        # Réduction progressive du contexte uniquement
-        context_tokens = tokenizer.encode(context)
-        keep_tokens = MAX_PROMPT_TOKENS - len(tokenizer.encode(base_prompt.replace(context, "")))
-        truncated_context = tokenizer.decode(context_tokens[:keep_tokens])
-        # Reconstruire le prompt avec contexte réduit
-        base_prompt = f"""Voici des informations sur des établissements et formations :
-{truncated_context}
-Formule ta réponse comme un conseiller d’orientation bienveillant, de manière fluide et naturelle.
-Question : {question}
-Réponse :"""
-    print("===== PROMPT ENVOYÉ =====")
-    print(base_prompt)
-    response = client.text_generation(prompt=base_prompt, max_new_tokens=MAX_NEW_TOKENS, timeout=30)
-    print("===== RÉPONSE REÇUE =====")
-    print(response)
-    return response  # selon format du retour

+import os
 import faiss
 import pickle
 import numpy as np
 import re
 from sentence_transformers import SentenceTransformer
+from transformers import AutoTokenizer, pipeline
 from huggingface_hub import InferenceClient
+# Choix du modèle
+HF_TOKEN = os.environ.get("edup2")
+if HF_TOKEN:
+    MODEL_NAME = "mistralai/Mistral-7B-Instruct-v0.1"
+    client = InferenceClient(MODEL_NAME, token=HF_TOKEN)
+    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, token=HF_TOKEN)
+    use_client = True
+else:
+    MODEL_NAME = "google/flan-t5-base"
+    generator = pipeline("text2text-generation", model=MODEL_NAME)
+    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+    use_client = False
 def load_faiss_index(index_path="faiss_index/faiss_index.faiss", doc_path="faiss_index/documents.pkl"):
     index = faiss.read_index(index_path)
     return context
 def generate_answer(question, context):
+    prompt = f"""Voici des informations sur des établissements et formations :
 {context}
 Question : {question}
 Réponse :"""
+    if use_client:
+        response = client.text_generation(prompt=prompt, max_new_tokens=300, timeout=30)
+        return response
+    else:
+        result = generator(prompt, max_new_tokens=256, do_sample=True)
+        return result[0]["generated_text"]

requirements.txt CHANGED Viewed

@@ -1,5 +1,6 @@
 gradio
-sentence-transformers
 faiss-cpu
-numpy
-requests

 gradio
 faiss-cpu
+sentence-transformers
+transformers
+huggingface_hub
+numpy