Training in progress, step 500

Files changed (6) hide show

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
     "epoch": 5.0,
-    "eval_accuracy": 0.027886497064579255,
-    "eval_bleu": 0.0021463467173750564,
-    "eval_loss": 8.901089668273926,
-    "eval_perplexity": 7339.967312596559,
-    "eval_runtime": 2.9365,
-    "eval_samples": 4,
-    "eval_samples_per_second": 1.362,
-    "eval_steps_per_second": 0.341,
-    "perplexity": 7339.967312596559,
-    "total_flos": 37111750410240.0,
-    "train_loss": 19.501985168457033,
-    "train_runtime": 33.6762,
-    "train_samples_per_second": 0.594,
-    "train_steps_per_second": 0.148
 }

 {
     "epoch": 5.0,
+    "eval_accuracy": 0.02236511042773274,
+    "eval_bleu": 0.002799146980613368,
+    "eval_loss": 9.125165939331055,
+    "eval_perplexity": 9183.52079846965,
+    "eval_runtime": 0.3917,
+    "eval_samples": 14,
+    "eval_samples_per_second": 35.745,
+    "eval_steps_per_second": 2.553,
+    "perplexity": 9183.52079846965,
+    "total_flos": 129891126435840.0,
+    "train_loss": 19.52422180175781,
+    "train_runtime": 23.5998,
+    "train_samples_per_second": 2.966,
+    "train_steps_per_second": 0.212
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 5.0,
-    "eval_accuracy": 0.027886497064579255,
-    "eval_bleu": 0.0021463467173750564,
-    "eval_loss": 8.901089668273926,
-    "eval_perplexity": 7339.967312596559,
-    "eval_runtime": 2.9365,
-    "eval_samples": 4,
-    "eval_samples_per_second": 1.362,
-    "eval_steps_per_second": 0.341,
-    "perplexity": 7339.967312596559
 }

 {
     "epoch": 5.0,
+    "eval_accuracy": 0.02236511042773274,
+    "eval_bleu": 0.002799146980613368,
+    "eval_loss": 9.125165939331055,
+    "eval_perplexity": 9183.52079846965,
+    "eval_runtime": 0.3917,
+    "eval_samples": 14,
+    "eval_samples_per_second": 35.745,
+    "eval_steps_per_second": 2.553,
+    "perplexity": 9183.52079846965
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:27bc8eb3b15560df54abe40fea156b75b88024ad128c5613eced7289e6007698
 size 1417229824

 version https://git-lfs.github.com/spec/v1
+oid sha256:219976ee5d77df2fc3e00e7db92d57c038d1bb3aea3345229f7edd6b186f3ee0
 size 1417229824

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 5.0,
-    "total_flos": 37111750410240.0,
-    "train_loss": 19.501985168457033,
-    "train_runtime": 33.6762,
-    "train_samples_per_second": 0.594,
-    "train_steps_per_second": 0.148
 }

 {
     "epoch": 5.0,
+    "total_flos": 129891126435840.0,
+    "train_loss": 19.52422180175781,
+    "train_runtime": 23.5998,
+    "train_samples_per_second": 2.966,
+    "train_steps_per_second": 0.212
 }

trainer_state.json CHANGED Viewed

@@ -11,11 +11,11 @@
     {
       "epoch": 5.0,
       "step": 5,
-      "total_flos": 37111750410240.0,
-      "train_loss": 19.501985168457033,
-      "train_runtime": 33.6762,
-      "train_samples_per_second": 0.594,
-      "train_steps_per_second": 0.148
     }
   ],
   "logging_steps": 100,
@@ -44,8 +44,8 @@
       "attributes": {}
     }
   },
-  "total_flos": 37111750410240.0,
-  "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null
 }

     {
       "epoch": 5.0,
       "step": 5,
+      "total_flos": 129891126435840.0,
+      "train_loss": 19.52422180175781,
+      "train_runtime": 23.5998,
+      "train_samples_per_second": 2.966,
+      "train_steps_per_second": 0.212
     }
   ],
   "logging_steps": 100,
       "attributes": {}
     }
   },
+  "total_flos": 129891126435840.0,
+  "train_batch_size": 64,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5cbf4e022680dd32fb89b366b15405b4a72821c9a060d5074735c6b62ff171bd
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:f1fb4d3347c522b6d98e9c675ffe42389ad29aa55352445e19a262742a998195
 size 5496