End of training

Files changed (4) hide show

all_results.json CHANGED Viewed

@@ -1,18 +1,18 @@
 {
     "epoch": 3.0,
-    "eval_accuracy": 0.9273952095808383,
-    "eval_f1": 0.9438332368268674,
-    "eval_loss": 0.23274052143096924,
-    "eval_precision": 0.9690844233055886,
-    "eval_recall": 0.9198645598194131,
-    "eval_roc_auc": 0.9310433910208176,
-    "eval_runtime": 1.9896,
     "eval_samples": 1336,
-    "eval_samples_per_second": 671.502,
-    "eval_steps_per_second": 5.529,
-    "train_loss": 0.19368775685628256,
-    "train_runtime": 134.498,
     "train_samples": 5342,
-    "train_samples_per_second": 119.154,
-    "train_steps_per_second": 0.937
 }

 {
     "epoch": 3.0,
+    "eval_accuracy": 0.9086826347305389,
+    "eval_f1": 0.9304446978335233,
+    "eval_loss": 0.22467140853405,
+    "eval_precision": 0.9400921658986175,
+    "eval_recall": 0.9209932279909706,
+    "eval_roc_auc": 0.9027188362177077,
+    "eval_runtime": 1.0843,
     "eval_samples": 1336,
+    "eval_samples_per_second": 1232.185,
+    "eval_steps_per_second": 5.534,
+    "train_loss": 0.2692271187191918,
+    "train_runtime": 63.0344,
     "train_samples": 5342,
+    "train_samples_per_second": 254.242,
+    "train_steps_per_second": 0.999
 }

eval_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 3.0,
-    "eval_accuracy": 0.9273952095808383,
-    "eval_f1": 0.9438332368268674,
-    "eval_loss": 0.23274052143096924,
-    "eval_precision": 0.9690844233055886,
-    "eval_recall": 0.9198645598194131,
-    "eval_roc_auc": 0.9310433910208176,
-    "eval_runtime": 1.9896,
     "eval_samples": 1336,
-    "eval_samples_per_second": 671.502,
-    "eval_steps_per_second": 5.529
 }

 {
     "epoch": 3.0,
+    "eval_accuracy": 0.9086826347305389,
+    "eval_f1": 0.9304446978335233,
+    "eval_loss": 0.22467140853405,
+    "eval_precision": 0.9400921658986175,
+    "eval_recall": 0.9209932279909706,
+    "eval_roc_auc": 0.9027188362177077,
+    "eval_runtime": 1.0843,
     "eval_samples": 1336,
+    "eval_samples_per_second": 1232.185,
+    "eval_steps_per_second": 5.534
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 3.0,
-    "train_loss": 0.19368775685628256,
-    "train_runtime": 134.498,
     "train_samples": 5342,
-    "train_samples_per_second": 119.154,
-    "train_steps_per_second": 0.937
 }

 {
     "epoch": 3.0,
+    "train_loss": 0.2692271187191918,
+    "train_runtime": 63.0344,
     "train_samples": 5342,
+    "train_samples_per_second": 254.242,
+    "train_steps_per_second": 0.999
 }

trainer_state.json CHANGED Viewed

@@ -2,43 +2,43 @@
   "best_metric": null,
   "best_model_checkpoint": null,
   "epoch": 3.0,
-  "global_step": 126,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.57,
-      "learning_rate": 4.9206349206349204e-05,
-      "loss": 0.2872,
-      "step": 66
     },
     {
       "epoch": 1.57,
-      "eval_accuracy": 0.9176646706586826,
-      "eval_f1": 0.9374999999999999,
-      "eval_loss": 0.20166487991809845,
-      "eval_precision": 0.9439359267734554,
-      "eval_recall": 0.9311512415349887,
-      "eval_roc_auc": 0.9111311763230499,
-      "eval_runtime": 1.9771,
-      "eval_samples_per_second": 675.722,
-      "eval_steps_per_second": 5.564,
-      "step": 66
     },
     {
       "epoch": 3.0,
-      "step": 126,
-      "total_flos": 2108308886599680.0,
-      "train_loss": 0.19368775685628256,
-      "train_runtime": 134.498,
-      "train_samples_per_second": 119.154,
-      "train_steps_per_second": 0.937
     }
   ],
-  "max_steps": 126,
   "num_train_epochs": 3,
-  "total_flos": 2108308886599680.0,
   "trial_name": null,
   "trial_params": null
 }

   "best_metric": null,
   "best_model_checkpoint": null,
   "epoch": 3.0,
+  "global_step": 63,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.57,
+      "learning_rate": 4.761904761904762e-05,
+      "loss": 0.36,
+      "step": 33
     },
     {
       "epoch": 1.57,
+      "eval_accuracy": 0.9124251497005988,
+      "eval_f1": 0.9341586944288126,
+      "eval_loss": 0.22648876905441284,
+      "eval_precision": 0.9315375982042648,
+      "eval_recall": 0.9367945823927766,
+      "eval_roc_auc": 0.9006195134186106,
+      "eval_runtime": 1.0671,
+      "eval_samples_per_second": 1252.042,
+      "eval_steps_per_second": 5.623,
+      "step": 33
     },
     {
       "epoch": 3.0,
+      "step": 63,
+      "total_flos": 1061461265430528.0,
+      "train_loss": 0.2692271187191918,
+      "train_runtime": 63.0344,
+      "train_samples_per_second": 254.242,
+      "train_steps_per_second": 0.999
     }
   ],
+  "max_steps": 63,
   "num_train_epochs": 3,
+  "total_flos": 1061461265430528.0,
   "trial_name": null,
   "trial_params": null
 }