Spaces:

nroggendorff
/

train-llama

Runtime error

nroggendorff commited on Jul 29, 2024

Commit

fe698eb

verified ·

1 Parent(s): d75dc64

Update train.py

Files changed (1) hide show

train.py CHANGED Viewed

@@ -7,11 +7,11 @@ from transformers import AutoTokenizer, LlamaConfig, LlamaForCausalLM, TrainingA
 from datasets import load_dataset
 from tokenizers import ByteLevelBPETokenizer
-MAX_SEQ_LENGTH = 512
 BATCH_SIZE = 16
 EPOCHS = 4
 LEARNING_RATE = 2e-4
-FACTOR = 4
 VOCAB_SIZE = 32000
 INPUT_DATASET = "nroggendorff/oak"
 OUTPUT_REPO = "smallama"

 from datasets import load_dataset
 from tokenizers import ByteLevelBPETokenizer
+MAX_SEQ_LENGTH = 128
 BATCH_SIZE = 16
 EPOCHS = 4
 LEARNING_RATE = 2e-4
+FACTOR = 2
 VOCAB_SIZE = 32000
 INPUT_DATASET = "nroggendorff/oak"
 OUTPUT_REPO = "smallama"