Spaces:
Sleeping
Sleeping
File size: 5,179 Bytes
21359d6 9255ae7 c11aeed 738953f e32eb03 7809235 c0d79c0 4a2256a 7809235 4a2256a 9255ae7 89a1906 9255ae7 7a0844c c0d79c0 4a2256a c11aeed afa597f c11aeed 4a2256a 6cec873 b30941e 6cec873 4a2256a c11aeed 4a2256a 6cec873 7809235 7a0844c 7809235 738953f 6cec873 738953f c0d79c0 84a86eb e32eb03 deac21a 738953f 7809235 738953f 4a2256a c11aeed 99346d8 84a86eb 738953f 7809235 738953f 7809235 e32eb03 fe44686 e32eb03 fe44686 e32eb03 c7680f3 89a1906 c7680f3 deac21a c7680f3 9255ae7 e32eb03 9255ae7 7a0844c e6fa88b 9255ae7 7a0844c 7809235 a000d3e 9255ae7 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 |
from huggingface_hub import InferenceClient
import gradio as gr
import re
client = InferenceClient("mistralai/Mixtral-8x7B-Instruct-v0.1")
# Variable globale pour compter les itérations
global_iteration = 0
# Variable globale pour stocker le contexte
global_context = {
"static_context": "Tu es le gérant d'une taverne dans le village de Montaillou au 14ème siècle dans l'univers des cathares dans les Pyrénées. Tu ne parles qu'en français. Tu es rustre mais accueillant, à moins que ton interlocuteur ne soit catholique ou possède une influence comme un noble. Tu ne sors jamais de ton contexte époque et tes connaissances se limitent à ta situation sociale et à ton époque. Tu dois être immersif et cohérent pour la personne qui va te parler. Prends toujours en compte l'historique de la conversation. Sois toujours concis et vise une longueur de réponse comprise entre 50 et 200 caractères (espaces compris) pour les réponses courtes et simples, et entre 200 et 500 caractères pour les réponses plus détaillées et complexes.",
"dynamic_context": "",
"sensitive_info_filter": [
"meurtre",
"implication",
"cacher",
"contexte caché",
"hidden_context",
],
}
# Créer une interface avec un champ de texte pour le contexte caché
context_input = gr.Textbox(
label="Contexte caché", value=global_context["static_context"]
)
def update_dynamic_context(user_input):
global global_context
keywords = {
"meutre": "Un meutre a été mentionné. Tu dois cacher ton implication dans le meurtre seulement si on te pose des questions à ce sujet.",
}
for keyword in keywords:
if keyword in user_input.lower():
global_context["dynamic_context"] += f" {keywords[keyword]}"
break
def filter_sensitive_info(text):
for word in global_context["sensitive_info_filter"]:
if word in text.lower():
return text.replace(word, "[REDACTED]")
return text
def remove_length_info(response_text):
pattern = r"\(\d+ caractères\)"
return re.sub(pattern, "", response_text)
def format_prompt(message, history):
max_history_length = 5 # Limiter la longueur de l'historique
history = history[-max_history_length:]
prompt = "<s>"
for user_prompt, bot_response in history:
prompt += f"[USER] {user_prompt} [/USER]"
if (
user_prompt == history[-1][0]
): # N'ajouter les balises [BOT] qu'autour de la dernière réponse du bot
prompt += f" [BOT]{filter_sensitive_info(bot_response)}[/BOT] "
else:
prompt += f" {filter_sensitive_info(bot_response)} "
prompt += f"</s>[INST][USER] {message} [/USER][/INST]"
# Ajouter le contexte statique et dynamique à chaque fois que l'utilisateur pose une question
prompt += f"[INST] {global_context['static_context']} {global_context['dynamic_context']} [/INST]"
return prompt
def generate(
prompt,
history,
temperature=0.2,
max_new_tokens=256,
top_p=0.95,
repetition_penalty=1.0,
):
temperature = float(temperature)
if temperature < 1e-2:
temperature = 1e-2
top_p = float(top_p)
generate_kwargs = dict(
temperature=temperature,
max_new_tokens=max_new_tokens,
top_p=top_p,
repetition_penalty=repetition_penalty,
do_sample=True,
seed=42,
)
update_dynamic_context(prompt)
formatted_prompt = format_prompt(prompt, history)
global global_iteration
global_iteration += 1
print(f"\n\nIteration {global_iteration}: {formatted_prompt}")
stream = client.text_generation(
formatted_prompt,
**generate_kwargs,
stream=True,
details=True,
return_full_text=False,
)
output = ""
for response in stream:
response_text = filter_sensitive_info(response.token.text)
response_text = remove_length_info(response_text)
output += response_text
yield output
return output
mychatbot = gr.Chatbot(
avatar_images=["./berger.jpg", "./tavernier.jpg"],
bubble_full_width=False,
show_label=False,
)
# Créer une interface pour le chatbot avec un champ de texte pour le contexte caché
def reset_history(chatbot):
chatbot.history = []
return []
def update_context(context):
global global_context
global_context["static_context"] = context
global mychatbot
mychatbot.history = reset_history(mychatbot)
global global_iteration
global_iteration = 0
return None
chatbot_interface = gr.ChatInterface(
fn=generate,
chatbot=mychatbot,
title="Tavernier 🍺",
retry_btn=None,
undo_btn=None,
)
# Ajouter le champ de texte pour le contexte caché à l'interface
context_interface = gr.Interface(
fn=update_context,
inputs=[context_input],
outputs=None,
title="Modifier le contexte caché",
description="Modifie le contexte caché du tavernier",
article=False,
)
demo = gr.TabbedInterface([chatbot_interface, context_interface], title="Tavernier 🍺")
# Afficher l'interface
demo.launch(inline=True)
|