Update handler.py
Browse files- handler.py +2 -3
handler.py
CHANGED
@@ -16,14 +16,13 @@ class EndpointHandler:
|
|
16 |
model_name,
|
17 |
device_map="auto",
|
18 |
torch_dtype=torch.float16,
|
19 |
-
offload_folder=offload_dir, # เพิ่มพารามิเตอร์นี้เพื่อระบุโฟลเดอร์สำหรับการ offload
|
20 |
offload_state_dict=True, # เปิดใช้งานการ offload state dict
|
21 |
-
offload_dir=offload_dir # ระบุ `offload_dir`
|
22 |
)
|
23 |
self.tokenizer = AutoTokenizer.from_pretrained(model_name)
|
24 |
|
25 |
# สร้าง pipeline สำหรับการสร้างข้อความ
|
26 |
-
self.generator = pipeline("text-generation", model=self.model, tokenizer=self.tokenizer, device_map="auto")
|
27 |
|
28 |
def __call__(self, data):
|
29 |
# รับข้อความ input จากผู้ใช้
|
|
|
16 |
model_name,
|
17 |
device_map="auto",
|
18 |
torch_dtype=torch.float16,
|
|
|
19 |
offload_state_dict=True, # เปิดใช้งานการ offload state dict
|
20 |
+
offload_dir=offload_dir # ระบุ `offload_dir` โดยตรงเพื่อจัดการการ offload ให้ถูกต้อง
|
21 |
)
|
22 |
self.tokenizer = AutoTokenizer.from_pretrained(model_name)
|
23 |
|
24 |
# สร้าง pipeline สำหรับการสร้างข้อความ
|
25 |
+
self.generator = pipeline("text-generation", model=self.model, tokenizer=self.tokenizer, device_map="auto", offload_folder=offload_dir)
|
26 |
|
27 |
def __call__(self, data):
|
28 |
# รับข้อความ input จากผู้ใช้
|