GPTfree api
commited on
Update app.py
Browse files
app.py
CHANGED
@@ -47,13 +47,14 @@ messages = [
|
|
47 |
# サンプリング設定
|
48 |
sampling_params = SamplingParams(max_tokens=512)
|
49 |
|
50 |
-
# LLMの初期化 (
|
51 |
llm = LLM(
|
52 |
model=model_name,
|
53 |
config_format="mistral",
|
54 |
load_format="mistral",
|
55 |
tokenizer_mode="mistral",
|
56 |
-
tensor_parallel_size=
|
|
|
57 |
limit_mm_per_prompt={"image": 4} # マルチモーダル入力制限
|
58 |
)
|
59 |
|
|
|
47 |
# サンプリング設定
|
48 |
sampling_params = SamplingParams(max_tokens=512)
|
49 |
|
50 |
+
# LLMの初期化 (CPUを利用)
|
51 |
llm = LLM(
|
52 |
model=model_name,
|
53 |
config_format="mistral",
|
54 |
load_format="mistral",
|
55 |
tokenizer_mode="mistral",
|
56 |
+
tensor_parallel_size=1, # CPUモードでは並列数は1
|
57 |
+
device="cpu", # 明示的にCPUを指定
|
58 |
limit_mm_per_prompt={"image": 4} # マルチモーダル入力制限
|
59 |
)
|
60 |
|