Spaces:

nroggendorff
/

train-llama

Starting on L40S

nroggendorff commited on Jul 24, 2024

Commit

da2f127

verified ·

1 Parent(s): 3647db8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -13,6 +13,8 @@ EPOCHS = 3
 LEARNING_RATE = 1e-4
 FP16 = True
 FACTOR = 8
 def load_data():
     dataset = load_dataset("nroggendorff/elephant", split="train")
@@ -22,7 +24,7 @@ def create_tokenizer():
     tokenizer = ByteLevelBPETokenizer()
     tokenizer.train_from_iterator(
         training_corpus,
-        vocab_size=3200,
         min_frequency=2,
         special_tokens=["<s>", "<pad>", "</s>", "<unk>", "<mask>", "<|user|>", "<|bot|>", "<|end|>"]
     )

 LEARNING_RATE = 1e-4
 FP16 = True
 FACTOR = 8
+VOCAB_SIZE = 3200
+DATASET = "nroggendorff/elephant"
 def load_data():
     dataset = load_dataset("nroggendorff/elephant", split="train")
     tokenizer = ByteLevelBPETokenizer()
     tokenizer.train_from_iterator(
         training_corpus,
+        vocab_size=VOCAB_SIZE,
         min_frequency=2,
         special_tokens=["<s>", "<pad>", "</s>", "<unk>", "<mask>", "<|user|>", "<|bot|>", "<|end|>"]
     )