Spaces:

hackergeek
/

Tuning

Running

hackergeek commited on Mar 17

Commit

71e1bba

verified ·

1 Parent(s): 006af89

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -64,9 +64,12 @@ def train_model(dataset_url, model_url, epochs):
         tokenized_datasets = dataset.map(tokenize_function, batched=True)
         train_dataset = tokenized_datasets["train"]
         training_args = TrainingArguments(
             output_dir="./deepseek_lora_cpu",
-            evaluation_strategy="epoch",
             learning_rate=5e-4,
             per_device_train_batch_size=1,
             per_device_eval_batch_size=1,
@@ -84,7 +87,8 @@ def train_model(dataset_url, model_url, epochs):
         trainer = Trainer(
             model=model,
             args=training_args,
-            train_dataset=train_dataset
         )
         log_status("🚀 ترینینگ شروع شد...")

         tokenized_datasets = dataset.map(tokenize_function, batched=True)
         train_dataset = tokenized_datasets["train"]
+        # Automatically check for validation dataset
+        eval_dataset = tokenized_datasets["validation"] if "validation" in tokenized_datasets else None
         training_args = TrainingArguments(
             output_dir="./deepseek_lora_cpu",
+            evaluation_strategy="epoch" if eval_dataset else "no",  # Enable evaluation if validation data exists
             learning_rate=5e-4,
             per_device_train_batch_size=1,
             per_device_eval_batch_size=1,
         trainer = Trainer(
             model=model,
             args=training_args,
+            train_dataset=train_dataset,
+            eval_dataset=eval_dataset  # Add eval dataset if available
         )
         log_status("🚀 ترینینگ شروع شد...")