Spaces:

soketlabs
/

pragna-chat

Runtime error

upperwal commited on Apr 25, 2024

Commit

42ac4a1

verified ·

1 Parent(s): 92a6dd7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,7 +8,7 @@ from threading import Thread
 # Loading the tokenizer and model from Hugging Face's model hub.
 tokenizer = AutoTokenizer.from_pretrained("soketlabs/pragna-1b", token=os.environ.get('HF_TOKEN'))
-model = AutoModelForCausalLM.from_pretrained("soketlabs/pragna-1b", token=os.environ.get('HF_TOKEN'))
 # using CUDA for an optimal experience
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
@@ -38,7 +38,7 @@ def predict(message, history):
     generate_kwargs = dict(
         model_inputs,
         streamer=streamer,
-        max_new_tokens=50,
         do_sample=True,
         top_p=0.95,
         top_k=50,

 # Loading the tokenizer and model from Hugging Face's model hub.
 tokenizer = AutoTokenizer.from_pretrained("soketlabs/pragna-1b", token=os.environ.get('HF_TOKEN'))
+model = AutoModelForCausalLM.from_pretrained("soketlabs/pragna-1b-it-v0.1", token=os.environ.get('HF_TOKEN'))
 # using CUDA for an optimal experience
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
     generate_kwargs = dict(
         model_inputs,
         streamer=streamer,
+        max_new_tokens=300,
         do_sample=True,
         top_p=0.95,
         top_k=50,