Spaces:

Locutusque
/

Locutusque-Models

Running on Zero

Locutusque commited on Sep 2, 2024

Commit

b6f59a7

verified ·

1 Parent(s): 6615fb0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,6 +10,7 @@ def load_model(model_name):
     return pipeline("text-generation", model=model_name, device_map="cuda", torch_dtype=torch.bfloat16, trust_remote_code=True, token=os.environ["token"], use_fast=True)
 @spaces.GPU()
 def generate(
     history,
     model_name,
     system,
@@ -28,7 +29,7 @@ def generate(
         prompt = f"<|im_start|>system\n{system}<|im_end|>\n"
         for (user_turn, assistant_turn) in history:
             prompt += f"<|im_start|>user\n{user_turn}<|im_end|>\n<|im_start|>assistant\n{assistant_turn}<|im_end|>\n"
-        prompt += f"<|im_start|>user\n{history[-1][0]}<|im_end|>\n<|im_start|>assistant\n"
         streamer = TextIteratorStreamer(pipe.tokenizer, timeout=240.0, skip_prompt=True, skip_special_tokens=True)
         generation_kwargs = dict(

     return pipeline("text-generation", model=model_name, device_map="cuda", torch_dtype=torch.bfloat16, trust_remote_code=True, token=os.environ["token"], use_fast=True)
 @spaces.GPU()
 def generate(
+    message,
     history,
     model_name,
     system,
         prompt = f"<|im_start|>system\n{system}<|im_end|>\n"
         for (user_turn, assistant_turn) in history:
             prompt += f"<|im_start|>user\n{user_turn}<|im_end|>\n<|im_start|>assistant\n{assistant_turn}<|im_end|>\n"
+        prompt += f"<|im_start|>user\n{message}<|im_end|>\n<|im_start|>assistant\n"
         streamer = TextIteratorStreamer(pipe.tokenizer, timeout=240.0, skip_prompt=True, skip_special_tokens=True)
         generation_kwargs = dict(