Spaces:
Runtime error
Runtime error
from huggingface_hub import InferenceClient | |
import gradio as gr | |
client = InferenceClient("mistralai/Mixtral-8x7B-Instruct-v0.1") | |
# Variable globale pour stocker le contexte | |
global_context = { | |
"hidden_context": "tu es le gérant d une taverne qui est cathare dans le village de montaillou dans l univers des cathares au 14 eme siecle dans les Pyrénées, parle que en français, tu es assez rustre mais demeure accueillant tant que son interlocuteur n est pas catholique ou possède une influence comme un noble, tu ne sors jamais de ton contexte par rapport à ton époque, tes connaissances se limite à ta situation sociale et ton époque, il faut que tu sois immersif pour la personne qui va te parler, et tu dois cacher ton implication dans le meutre seulement si on te pose des questions à ce sujet sinon tu n évoque juste pas ce sujet, prends bien toujours en compte l historique de ta conversation, sois toujours concis et tu dois viser une longueur de réponse comprise entre 50 et 200 caractères (espaces compris) pour les réponses courtes et simples, et entre 200 et 500 caractères pour les réponses plus détaillées et complexes. Réponds à la dernière requête posée par le user" | |
} | |
# Créer une interface avec un champ de texte pour le contexte caché | |
context_input = gr.Textbox( | |
label="Contexte caché", value=global_context["hidden_context"] | |
) | |
def update_context(context): | |
global global_context | |
global_context["hidden_context"] = context | |
return None | |
def format_prompt(message, history): | |
prompt = "<s>" | |
for user_prompt, bot_response in history: | |
prompt += f"[INST] {user_prompt} [/INST]" | |
prompt += f" {bot_response}</s> " | |
prompt += f"[INST] {message} [/INST]" | |
# Ajouter le contexte caché à chaque fois que l'utilisateur pose une question | |
if message: | |
prompt += f"[INST] {global_context['hidden_context']} [/INST]" | |
return prompt | |
def generate( | |
prompt, | |
history, | |
temperature=0.2, | |
max_new_tokens=256, | |
top_p=0.95, | |
repetition_penalty=1.0, | |
): | |
temperature = float(temperature) | |
if temperature < 1e-2: | |
temperature = 1e-2 | |
top_p = float(top_p) | |
generate_kwargs = dict( | |
temperature=temperature, | |
max_new_tokens=max_new_tokens, | |
top_p=top_p, | |
repetition_penalty=repetition_penalty, | |
do_sample=True, | |
seed=42, | |
) | |
formatted_prompt = format_prompt(prompt, history) | |
print(formatted_prompt) | |
stream = client.text_generation( | |
formatted_prompt, | |
**generate_kwargs, | |
stream=True, | |
details=True, | |
return_full_text=False, | |
) | |
output = "" | |
for response in stream: | |
# Exclure le contexte caché de la réponse retournée par le modèle | |
response_text = response.token.text.replace( | |
global_context["hidden_context"], "" | |
) | |
output += response_text | |
yield output | |
return output | |
mychatbot = gr.Chatbot( | |
avatar_images=["./berger.jpg", "./tavernier.jpg"], | |
bubble_full_width=False, | |
show_label=False, | |
) | |
# Créer une interface pour le chatbot avec un champ de texte pour le contexte caché | |
chatbot_interface = gr.Interface( | |
fn=generate, | |
inputs="text", | |
outputs="text", | |
title="Tavernier 🍺", | |
description="Discute avec le tavernier cathare de Montaillou", | |
examples=[["Bonjour, puis-je avoir une bière ?"]], | |
input_type="text", | |
output_type="text", | |
input_label="Message", | |
output_label="Réponse", | |
theme="huggingface", | |
article=False, | |
clear_input=True, | |
chatbot=mychatbot, | |
chatbot_name="Tavernier", | |
chatbot_avatar="./tavernier.jpg", | |
flags=gr.Chatbot.flags_from_names(["user", "bot"]), | |
elem_id="chatbot", | |
) | |
# Ajouter le champ de texte pour le contexte caché à l'interface | |
context_interface = gr.Interface( | |
fn=update_context, | |
inputs=context_input, | |
outputs=None, | |
title="Modifier le contexte caché", | |
description="Modifie le contexte caché du tavernier", | |
theme="huggingface", | |
article=False, | |
) | |
# Afficher l'interface | |
context_interface.launch(inline=True) | |
chatbot_interface.launch(inline=True) | |