Spaces:

harsh-manvar
/

vllm-test-ui

Runtime error

harsh-manvar commited on Dec 25, 2024

Commit

7fb3374

verified ·

1 Parent(s): 0cf4f08

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,10 +2,9 @@ import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 from vllm import SamplingParams, LLM
-# Load the model and tokenizer from Hugging Face
-model_name = "Qwen/Qwen2-7B"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-engine = LLM.from_pretrained(model_name)
 def generate_response(prompt, max_tokens, temperature, top_p):
     # Tokenize the prompt

 from transformers import AutoModelForCausalLM, AutoTokenizer
 from vllm import SamplingParams, LLM
+# Load the model and tokenizer from Hugging Face
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+engine = LLM(model="Qwen/Qwen2-7B")
 def generate_response(prompt, max_tokens, temperature, top_p):
     # Tokenize the prompt