Training in progress, step 2900

Browse files

Files changed (8) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +3 -69
last-checkpoint/training_args.bin +1 -1
model.safetensors +1 -1
runs/Dec06_11-00-30_434437f2320b/events.out.tfevents.1701860453.434437f2320b.298.0 +2 -2

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5002534ec028fd851fb4ded8fa6870b5e88a87b3aea83489064e50c2d130c705
 size 966995080

 version https://git-lfs.github.com/spec/v1
+oid sha256:bc9ce79fc599740aef87f7fd48706228015ab07b2a1dfd751d72c6184f855c03
 size 966995080

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e2ebf35cde40a2b2b8bd1babda4caa0c0a3c31716b985086a7f3492df8e73146
 size 1925064044

 version https://git-lfs.github.com/spec/v1
+oid sha256:d306912bc344aaf32285eaf9f48c11bfb51cf53853d6ee359fddf97240bd0bb9
 size 1925064044

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:714c497832efbd30b453ea1dc41b88588aa1ef3ef61cc437c7721d0a697f8351
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:bdbc32589e7c655d36a5fb4597ce0c5aa1b6a41b9f31868102fdf367046c16aa
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3922750f8285a08036594458e370c6bf581fd29e29990b555381b09978530df4
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:709fa179bb7fc9a25ddcbc282cb67b6963af0127c69eb4336b37c5b7c5aba9e9
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
-  "epoch": 5.34351145038168,
   "eval_steps": 100,
-  "global_step": 2800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -865,72 +865,6 @@
       "eval_steps_per_second": 0.103,
       "eval_wer": 181.14254021075985,
       "step": 2600
-    },
-    {
-      "epoch": 5.01,
-      "learning_rate": 3.945714285714286e-06,
-      "loss": 0.0156,
-      "step": 2625
-    },
-    {
-      "epoch": 5.06,
-      "learning_rate": 3.874285714285715e-06,
-      "loss": 0.0086,
-      "step": 2650
-    },
-    {
-      "epoch": 5.1,
-      "learning_rate": 3.802857142857143e-06,
-      "loss": 0.0075,
-      "step": 2675
-    },
-    {
-      "epoch": 5.15,
-      "learning_rate": 3.731428571428572e-06,
-      "loss": 0.009,
-      "step": 2700
-    },
-    {
-      "epoch": 5.15,
-      "eval_loss": 0.43247538805007935,
-      "eval_runtime": 1622.3539,
-      "eval_samples_per_second": 0.925,
-      "eval_steps_per_second": 0.116,
-      "eval_wer": 161.67498613422075,
-      "step": 2700
-    },
-    {
-      "epoch": 5.2,
-      "learning_rate": 3.66e-06,
-      "loss": 0.0074,
-      "step": 2725
-    },
-    {
-      "epoch": 5.25,
-      "learning_rate": 3.588571428571429e-06,
-      "loss": 0.0096,
-      "step": 2750
-    },
-    {
-      "epoch": 5.3,
-      "learning_rate": 3.5171428571428573e-06,
-      "loss": 0.0098,
-      "step": 2775
-    },
-    {
-      "epoch": 5.34,
-      "learning_rate": 3.4457142857142863e-06,
-      "loss": 0.0069,
-      "step": 2800
-    },
-    {
-      "epoch": 5.34,
-      "eval_loss": 0.43616336584091187,
-      "eval_runtime": 1644.4427,
-      "eval_samples_per_second": 0.912,
-      "eval_steps_per_second": 0.114,
-      "eval_wer": 161.19661674986133,
-      "step": 2800
     }
   ],
   "logging_steps": 25,
@@ -938,7 +872,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
-  "total_flos": 2.58471513796608e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
+  "epoch": 4.961832061068702,
   "eval_steps": 100,
+  "global_step": 2600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.103,
       "eval_wer": 181.14254021075985,
       "step": 2600
     }
   ],
   "logging_steps": 25,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
+  "total_flos": 2.400222491541504e+19,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e2c92dac35d16dc814e0a1581e1901c1f2948813ba744cab88f1ca1434e0d291
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:96eac9b215a976aa2dd9548a4525c1b8963c1f6f7769df3b71271d00769da268
 size 4856

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5002534ec028fd851fb4ded8fa6870b5e88a87b3aea83489064e50c2d130c705
 size 966995080

 version https://git-lfs.github.com/spec/v1
+oid sha256:4322cb52e7375952b1b7c62f67285f280a31e123ef3ec661fb690ab98ec4501d
 size 966995080

runs/Dec06_11-00-30_434437f2320b/events.out.tfevents.1701860453.434437f2320b.298.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:49bfeade977e6cf0897b542b21b891e17ad33a1f61b6eecb801ff6478469a75f
-size 7065

 version https://git-lfs.github.com/spec/v1
+oid sha256:0da207cb9892cfaa4ee5e358be4b072f8ded1d547815263b874d31dbb9860a68
+size 8011