tangledgroup
/

tangled-alpha-0.9-core

Text Generation

Model card Files Files and versions

mtasic85 commited on Mar 15

Commit

756b2ff

·

1 Parent(s): 2a2899b

cpt core 4

Files changed (1) hide show

scripts/cpt_core_model_4.py +2 -1

scripts/cpt_core_model_4.py CHANGED Viewed

@@ -85,7 +85,7 @@ def unlsoth_generator():
         break
-train_dataset = Dataset.from_generator(unlsoth_generator, max_steps=len(litgpt_streaming_dataset), streaming=True)
 from trl import SFTTrainer
@@ -101,6 +101,7 @@ trainer = UnslothTrainer(
     dataset_text_field='text',
     max_seq_length=max_seq_length,
     dataset_num_proc=32,
     args = UnslothTrainingArguments(
         per_device_train_batch_size=8,

         break
+train_dataset = Dataset.from_generator(unlsoth_generator, streaming=True)
 from trl import SFTTrainer
     dataset_text_field='text',
     max_seq_length=max_seq_length,
     dataset_num_proc=32,
+    max_steps=len(litgpt_streaming_dataset),
     args = UnslothTrainingArguments(
         per_device_train_batch_size=8,