File size: 977 Bytes
32d79c1
 
 
 
da38329
 
32d79c1
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
# import gradio as gr

# gr.load("models/Qwen/Qwen2.5-Coder-32B-Instruct").launch()

import gradio as gr

# تنظیمات برای استفاده از GPU (در صورت موجود بودن)
device = "cuda" if torch.cuda.is_available() else "cpu"

# بارگذاری مدل با استفاده از تنظیمات بهینه
model = gr.load(
    "models/Qwen/Qwen2.5-Coder-32B-Instruct", 
    device=device,  # اجرا روی GPU (یا CPU در صورت نبود GPU)
    low_cpu_mem_usage=True  # کاهش مصرف حافظه
)

# اجرای رابط کاربری با بهینه‌سازی برای بازدهی بهتر
model.launch(
    server_name="0.0.0.0",  # قابل دسترسی از شبکه
    server_port=7860,       # پورت مناسب برای دسترسی
    share=True,             # اشتراک‌گذاری لینک عمومی (در صورت نیاز)
    enable_queue=True       # صف‌بندی درخواست‌ها برای مدیریت بار
)