Spaces:

Maryem2025
/

Recipe_Chatbot_Project

Running

App Files Files Community

Maryem2025 commited on Jan 26

Commit

7e887c6

verified ·

1 Parent(s): 7fd9767

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -39

app.py CHANGED Viewed

@@ -1,3 +1,4 @@
 import os
 from huggingface_hub import login
 from datasets import load_dataset
@@ -6,33 +7,33 @@ from llama_cpp import Llama
 from huggingface_hub import hf_hub_download
 import chromadb
 from sentence_transformers import SentenceTransformer
-import time
 # Charger le token depuis les secrets
 hf_token = os.getenv("HF_TOKEN")  # Assurez-vous que 'HF_TOKEN' est bien le nom du secret Hugging Face
 # Connecte-toi à Hugging Face
 login(hf_token)
-# Charger le dataset une seule fois
-dataset = load_dataset("Maryem2025/dataset-test")  # Chargez le dataset une fois
-# Initialisation du modèle Llama avec une taille de contexte réduite
 llm = Llama(
     model_path=hf_hub_download(
         repo_id="TheBloke/CapybaraHermes-2.5-Mistral-7B-GGUF",
         filename="capybarahermes-2.5-mistral-7b.Q2_K.gguf",
     ),
-    n_ctx=1024,  # Réduire la taille du contexte
     n_gpu_layers=50,  # Ajustez selon votre VRAM
 )
 # Initialisation de ChromaDB Vector Store
 class VectorStore:
-    def __init__(self, collection_name, batch_size=10):
         self.embedding_model = SentenceTransformer('sentence-transformers/multi-qa-MiniLM-L6-cos-v1')
         self.chroma_client = chromadb.Client()
-        self.batch_size = batch_size
         # Supprimer la collection existante si elle existe
         if collection_name in self.chroma_client.list_collections():
@@ -46,6 +47,7 @@ class VectorStore:
         names = dataset['train']['name'][:200]
         ingredients = dataset['train']['ingredients'][:200]
         instructions = dataset['train']['instructions'][:200]
         cuisine = dataset['train']['cuisine'][:200]
         total_time = dataset['train']['total_time'][:200]
@@ -53,41 +55,27 @@ class VectorStore:
         texts = [
             f"Name: {name}. Ingredients: {ingr}. Instructions: {instr}. Cuisine: {cui}. Total time: {total} minutes."
             for name, ingr, instr, cui, total in zip(names, ingredients, instructions, cuisine, total_time)
         ]
-        embeddings_batch = []
-        documents_batch = []
         for i, item in enumerate(texts):
             embeddings = self.embedding_model.encode(item).tolist()
-            embeddings_batch.append(embeddings)
-            documents_batch.append(item)
-            # Quand le batch est plein, on ajoute les embeddings
-            if len(embeddings_batch) >= self.batch_size:
-                self.collection.add(embeddings=embeddings_batch, documents=documents_batch, ids=[str(i) for i in range(i - self.batch_size + 1, i + 1)])
-                embeddings_batch = []
-                documents_batch = []
-        # Ajouter les derniers items restants s'il y en a
-        if embeddings_batch:
-            self.collection.add(embeddings=embeddings_batch, documents=documents_batch, ids=[str(i) for i in range(len(texts) - len(embeddings_batch), len(texts))])
     def search_context(self, query, n_results=1):
         query_embedding = self.embedding_model.encode([query]).tolist()
         results = self.collection.query(query_embeddings=query_embedding, n_results=n_results)
         return results['documents']
-# Initialisation du store de vecteurs et peuplement du dataset
 vector_store = VectorStore("embedding_vector")
 vector_store.populate_vectors(dataset)
 # Fonction pour générer du texte
 def generate_text(message, max_tokens, temperature, top_p):
-    # Profiler le temps d'exécution de la génération de texte
-    start_time = time.time()
     # Récupérer le contexte depuis le store de vecteurs
     context_results = vector_store.search_context(message, n_results=1)
     context = context_results[0] if context_results else ""
@@ -103,24 +91,19 @@ def generate_text(message, max_tokens, temperature, top_p):
     # Générer le texte avec le modèle de langue
     output = llm(
         prompt_template,
-        temperature=temperature,
-        top_p=top_p,
         top_k=40,
         repeat_penalty=1.1,
-        max_tokens=max_tokens,
     )
     # Traiter la sortie
     input_string = output['choices'][0]['text'].strip()
     cleaned_text = input_string.strip("[]'").replace('\\n', '\n')
     continuous_text = '\n'.join(cleaned_text.split('\n'))
-    # Afficher le temps d'exécution
-    print(f"Temps d'exécution pour générer du texte : {time.time() - start_time} secondes")
     return continuous_text
 # Définir l'interface Gradio
 demo = gr.Interface(
     fn=generate_text,
@@ -128,9 +111,8 @@ demo = gr.Interface(
         gr.Textbox(lines=2, placeholder="Enter your message here...", label="Message"),
     ],
     outputs=gr.Textbox(label="Generated Text"),
-    title="Chatbot - Your Personal Culinary Advisor",
     description="Running LLM with context retrieval from ChromaDB",
-    cache_examples=False,  # Désactivez le cache
     examples=[
         ["I have leftover rice, what can I make out of it?"],
         ["I just have some milk and chocolate, what dessert can I make?"],
@@ -138,7 +120,8 @@ demo = gr.Interface(
         ["Can you suggest a vegan breakfast recipe?"],
         ["How do I make a perfect scrambled egg?"],
         ["Can you guide me through making a soufflé?"],
-    ],  # Réduire le nombre d'exemples pour accélérer
 )
 if __name__ == "__main__":

+############ it works , الحمد لله
 import os
 from huggingface_hub import login
 from datasets import load_dataset
 from huggingface_hub import hf_hub_download
 import chromadb
 from sentence_transformers import SentenceTransformer
+import os
+from huggingface_hub import login
 # Charger le token depuis les secrets
 hf_token = os.getenv("HF_TOKEN")  # Assurez-vous que 'HF_TOKEN' est bien le nom du secret Hugging Face
 # Connecte-toi à Hugging Face
 login(hf_token)
+# Charger le dataset
+dataset = load_dataset("Maryem2025/dataset-train")  # Changez le nom si nécessaire
+# Initialisation du modèle Llama
 llm = Llama(
     model_path=hf_hub_download(
         repo_id="TheBloke/CapybaraHermes-2.5-Mistral-7B-GGUF",
         filename="capybarahermes-2.5-mistral-7b.Q2_K.gguf",
     ),
+    n_ctx=2048,
     n_gpu_layers=50,  # Ajustez selon votre VRAM
 )
 # Initialisation de ChromaDB Vector Store
 class VectorStore:
+    def __init__(self, collection_name):
         self.embedding_model = SentenceTransformer('sentence-transformers/multi-qa-MiniLM-L6-cos-v1')
         self.chroma_client = chromadb.Client()
         # Supprimer la collection existante si elle existe
         if collection_name in self.chroma_client.list_collections():
         names = dataset['train']['name'][:200]
         ingredients = dataset['train']['ingredients'][:200]
         instructions = dataset['train']['instructions'][:200]
         cuisine = dataset['train']['cuisine'][:200]
         total_time = dataset['train']['total_time'][:200]
         texts = [
             f"Name: {name}. Ingredients: {ingr}. Instructions: {instr}. Cuisine: {cui}. Total time: {total} minutes."
             for name, ingr, instr, cui, total in zip(names, ingredients, instructions, cuisine, total_time)
+            #f"Name: {name}. Ingredients: {ingr}. Instructions: {instr}."
+            #for name, ingr, instr in zip(names, ingredients, instructions)
         ]
+        # Ajouter les embeddings au store de vecteurs
         for i, item in enumerate(texts):
             embeddings = self.embedding_model.encode(item).tolist()
+            self.collection.add(embeddings=[embeddings], documents=[item], ids=[str(i)])
     def search_context(self, query, n_results=1):
         query_embedding = self.embedding_model.encode([query]).tolist()
         results = self.collection.query(query_embeddings=query_embedding, n_results=n_results)
         return results['documents']
+# Initialisation du store de vecteurs et peuplement
+dataset = load_dataset('Maryem2025/dataset-test')
 vector_store = VectorStore("embedding_vector")
 vector_store.populate_vectors(dataset)
 # Fonction pour générer du texte
 def generate_text(message, max_tokens, temperature, top_p):
     # Récupérer le contexte depuis le store de vecteurs
     context_results = vector_store.search_context(message, n_results=1)
     context = context_results[0] if context_results else ""
     # Générer le texte avec le modèle de langue
     output = llm(
         prompt_template,
+        temperature=0.3,
+        top_p=0.95,
         top_k=40,
         repeat_penalty=1.1,
+        max_tokens=600,
     )
     # Traiter la sortie
     input_string = output['choices'][0]['text'].strip()
     cleaned_text = input_string.strip("[]'").replace('\\n', '\n')
     continuous_text = '\n'.join(cleaned_text.split('\n'))
     return continuous_text
 # Définir l'interface Gradio
 demo = gr.Interface(
     fn=generate_text,
         gr.Textbox(lines=2, placeholder="Enter your message here...", label="Message"),
     ],
     outputs=gr.Textbox(label="Generated Text"),
+    title="Chatbot - Your Personal Culinary Advisor: Discover What to Cook Next!",
     description="Running LLM with context retrieval from ChromaDB",
     examples=[
         ["I have leftover rice, what can I make out of it?"],
         ["I just have some milk and chocolate, what dessert can I make?"],
         ["Can you suggest a vegan breakfast recipe?"],
         ["How do I make a perfect scrambled egg?"],
         ["Can you guide me through making a soufflé?"],
+    ],
+    cache_examples=False,
 )
 if __name__ == "__main__":