sarashi0811
/

llm2024_v3

Model card Files Files and versions Community

sarashi0811 commited on Dec 24, 2024

Commit

57c6c16

·

verified ·

1 Parent(s): 59e7291

Update README.md

Files changed (1) hide show

README.md +1 -8

README.md CHANGED Viewed

@@ -1,3 +1,4 @@
 ```
 !pip install -U bitsandbytes
@@ -18,9 +19,7 @@ from peft import PeftModel
 import torch
 from tqdm import tqdm
 import json
-```
-```
 model_id = "sarashi0811/llm2024_v3"
 # QLoRA config
@@ -39,9 +38,7 @@ model = AutoModelForCausalLM.from_pretrained(
 # Load tokenizer
 tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
-```
-```
 # データセットの読み込み。
 # omnicampusの開発環境では、左にタスクのjsonlをドラッグアンドドロップしてから実行。
 datasets = []
@@ -53,9 +50,7 @@ with open("./elyza-tasks-100-TV_0.jsonl", "r") as f:
       if item.endswith("}"):
         datasets.append(json.loads(item))
         item = ""
-```
-```
 results = []
 for data in tqdm(datasets):
@@ -80,9 +75,7 @@ for data in tqdm(datasets):
   output = tokenizer.decode(outputs[tokenized_input.size(1):], skip_special_tokens=True)
   results.append({"task_id": data["task_id"], "input": input, "output": output})
-```
-```
 import re
 jsonl_id = re.sub(".*/", "", "check")
 with open(f"./{jsonl_id}-outputs.jsonl", 'w', encoding='utf-8') as f:

+以下、推論用のコードになります。
 ```
 !pip install -U bitsandbytes
 import torch
 from tqdm import tqdm
 import json
 model_id = "sarashi0811/llm2024_v3"
 # QLoRA config
 # Load tokenizer
 tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
 # データセットの読み込み。
 # omnicampusの開発環境では、左にタスクのjsonlをドラッグアンドドロップしてから実行。
 datasets = []
       if item.endswith("}"):
         datasets.append(json.loads(item))
         item = ""
 results = []
 for data in tqdm(datasets):
   output = tokenizer.decode(outputs[tokenized_input.size(1):], skip_special_tokens=True)
   results.append({"task_id": data["task_id"], "input": input, "output": output})
 import re
 jsonl_id = re.sub(".*/", "", "check")
 with open(f"./{jsonl_id}-outputs.jsonl", 'w', encoding='utf-8') as f: