ElouarnLC
add context text box et prompt debugging
7a0844c
raw
history blame
4.17 kB
from huggingface_hub import InferenceClient
import gradio as gr
client = InferenceClient("mistralai/Mixtral-8x7B-Instruct-v0.1")
# Variable globale pour stocker le contexte
global_context = {
"hidden_context": "tu es le gérant d une taverne qui est cathare dans le village de montaillou dans l univers des cathares au 14 eme siecle dans les Pyrénées, parle que en français, tu es assez rustre mais demeure accueillant tant que son interlocuteur n est pas catholique ou possède une influence comme un noble, tu ne sors jamais de ton contexte par rapport à ton époque, tes connaissances se limite à ta situation sociale et ton époque, il faut que tu sois immersif pour la personne qui va te parler, et tu dois cacher ton implication dans le meutre seulement si on te pose des questions à ce sujet sinon tu n évoque juste pas ce sujet, prends bien toujours en compte l historique de ta conversation, sois toujours concis et tu dois viser une longueur de réponse comprise entre 50 et 200 caractères (espaces compris) pour les réponses courtes et simples, et entre 200 et 500 caractères pour les réponses plus détaillées et complexes. Réponds à la dernière requête posée par le user"
}
# Créer une interface avec un champ de texte pour le contexte caché
context_input = gr.Textbox(
label="Contexte caché", value=global_context["hidden_context"]
)
def update_context(context):
global global_context
global_context["hidden_context"] = context
return None
def format_prompt(message, history):
prompt = "<s>"
for user_prompt, bot_response in history:
prompt += f"[INST] {user_prompt} [/INST]"
prompt += f" {bot_response}</s> "
prompt += f"[INST] {message} [/INST]"
# Ajouter le contexte caché à chaque fois que l'utilisateur pose une question
if message:
prompt += f"[INST] {global_context['hidden_context']} [/INST]"
return prompt
def generate(
prompt,
history,
temperature=0.2,
max_new_tokens=256,
top_p=0.95,
repetition_penalty=1.0,
):
temperature = float(temperature)
if temperature < 1e-2:
temperature = 1e-2
top_p = float(top_p)
generate_kwargs = dict(
temperature=temperature,
max_new_tokens=max_new_tokens,
top_p=top_p,
repetition_penalty=repetition_penalty,
do_sample=True,
seed=42,
)
formatted_prompt = format_prompt(prompt, history)
print(formatted_prompt)
stream = client.text_generation(
formatted_prompt,
**generate_kwargs,
stream=True,
details=True,
return_full_text=False,
)
output = ""
for response in stream:
# Exclure le contexte caché de la réponse retournée par le modèle
response_text = response.token.text.replace(
global_context["hidden_context"], ""
)
output += response_text
yield output
return output
mychatbot = gr.Chatbot(
avatar_images=["./berger.jpg", "./tavernier.jpg"],
bubble_full_width=False,
show_label=False,
)
# Créer une interface pour le chatbot avec un champ de texte pour le contexte caché
chatbot_interface = gr.Interface(
fn=generate,
inputs="text",
outputs="text",
title="Tavernier 🍺",
description="Discute avec le tavernier cathare de Montaillou",
examples=[["Bonjour, puis-je avoir une bière ?"]],
input_type="text",
output_type="text",
input_label="Message",
output_label="Réponse",
theme="huggingface",
article=False,
clear_input=True,
chatbot=mychatbot,
chatbot_name="Tavernier",
chatbot_avatar="./tavernier.jpg",
flags=gr.Chatbot.flags_from_names(["user", "bot"]),
elem_id="chatbot",
)
# Ajouter le champ de texte pour le contexte caché à l'interface
context_interface = gr.Interface(
fn=update_context,
inputs=context_input,
outputs=None,
title="Modifier le contexte caché",
description="Modifie le contexte caché du tavernier",
theme="huggingface",
article=False,
)
# Afficher l'interface
context_interface.launch(inline=True)
chatbot_interface.launch(inline=True)