Spaces:

nroggendorff
/

train-llama

Runtime error

nroggendorff commited on Jul 28, 2024

Commit

3e561fb

verified ·

1 Parent(s): 88f2941

Update train.py

Files changed (1) hide show

train.py CHANGED Viewed

@@ -7,11 +7,11 @@ from transformers import AutoTokenizer, LlamaConfig, LlamaForCausalLM, TrainingA
 from datasets import load_dataset
 from tokenizers import ByteLevelBPETokenizer
-MAX_SEQ_LENGTH = 128
-BATCH_SIZE = 512
 EPOCHS = 10
 LEARNING_RATE = 2e-5
-FACTOR = 4
 VOCAB_SIZE = 32000
 INPUT_DATASET = "nroggendorff/oak"
 OUTPUT_REPO = "smallama"

 from datasets import load_dataset
 from tokenizers import ByteLevelBPETokenizer
+MAX_SEQ_LENGTH = 512
+BATCH_SIZE = 16
 EPOCHS = 10
 LEARNING_RATE = 2e-5
+FACTOR = 128
 VOCAB_SIZE = 32000
 INPUT_DATASET = "nroggendorff/oak"
 OUTPUT_REPO = "smallama"