Spaces:

harsh-manvar
/

vllm-test-ui

Runtime error

harsh-manvar commited on Dec 25, 2024

Commit

0cf4f08

verified ·

1 Parent(s): d4c8683

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,11 +1,11 @@
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
-from vllm import LLMEngine, SamplingParams
 # Load the model and tokenizer from Hugging Face
 model_name = "Qwen/Qwen2-7B"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-engine = LLMEngine(model=model_name)
 def generate_response(prompt, max_tokens, temperature, top_p):
     # Tokenize the prompt

 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
+from vllm import SamplingParams, LLM
 # Load the model and tokenizer from Hugging Face
 model_name = "Qwen/Qwen2-7B"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+engine = LLM.from_pretrained(model_name)
 def generate_response(prompt, max_tokens, temperature, top_p):
     # Tokenize the prompt