Spaces:

nroggendorff
/

train-llama

Runtime error

nroggendorff commited on Sep 2, 2024

Commit

6f9e2c0

verified ·

1 Parent(s): d9cef8e

Update train.py

Files changed (1) hide show

train.py CHANGED Viewed

@@ -3,11 +3,11 @@ import os
 import torch
 import trl
-from transformers import AutoTokenizer, LlamaConfig, LlamaForCausalLM, TrainingArguments, PreTrainedTokenizerFast, AdamW, get_cosine_schedule_with_warmup
 from datasets import load_dataset, Dataset
 from tokenizers import ByteLevelBPETokenizer
-BATCH_SIZE = 1
 EPOCHS = 2
 LEARNING_RATE = 2e-3
 FACTOR = 22 * 66
@@ -99,7 +99,7 @@ def create_model(tokenizer):
     return model
 def load_model():
-    model = LlamaForCausalLM.from_pretrained(OUTPUT_REPO)
     return model
 def configure_tokenizer(tokenizer):

 import torch
 import trl
+from transformers import AutoTokenizer, LlamaConfig, AutoModelForCasualLM, LlamaForCausalLM, TrainingArguments, PreTrainedTokenizerFast, AdamW, get_cosine_schedule_with_warmup
 from datasets import load_dataset, Dataset
 from tokenizers import ByteLevelBPETokenizer
+BATCH_SIZE = 4
 EPOCHS = 2
 LEARNING_RATE = 2e-3
 FACTOR = 22 * 66
     return model
 def load_model():
+    model = AutoModelForCasualLM.from_pretrained(OUTPUT_REPO)
     return model
 def configure_tokenizer(tokenizer):