Spaces:

harsh-manvar
/

vllm-test-ui

Runtime error

harsh-manvar commited on Dec 26, 2024

Commit

ed53c37

verified ·

1 Parent(s): 371bc95

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,11 +1,11 @@
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
-from vllm import SamplingParams, LLM
 # Load the model and tokenizer from Hugging Face
-model_name = "Qwen/Qwen2-7B"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-vllm_model = LLM(model="Qwen/Qwen2-7B")
 def generate_response(prompt, max_tokens, temperature, top_p):
     # Tokenize the prompt

 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
+from vllm import LLM, SamplingParams
 # Load the model and tokenizer from Hugging Face
+model_name = "Qwen/Qwen2-0.5B"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+vllm_model = LLM(model="Qwen/Qwen2-0.5B")
 def generate_response(prompt, max_tokens, temperature, top_p):
     # Tokenize the prompt