End of training

Browse files

Files changed (4) hide show

README.md +1 -1
all_results.json +6 -6
test_results.json +6 -6
trainer_state.json +149 -261

README.md CHANGED Viewed

@@ -18,7 +18,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [MCG-NJU/videomae-base](https://huggingface.co/MCG-NJU/videomae-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.2252
 - Accuracy: 0.9290
 ## Model description

 This model is a fine-tuned version of [MCG-NJU/videomae-base](https://huggingface.co/MCG-NJU/videomae-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2267
 - Accuracy: 0.9290
 ## Model description

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 7.113333333333333,
-    "eval_accuracy": 0.9548387096774194,
-    "eval_loss": 0.1593276411294937,
-    "eval_runtime": 16.3684,
-    "eval_samples_per_second": 9.469,
-    "eval_steps_per_second": 1.222
 }

 {
+    "epoch": 7.101351351351352,
+    "eval_accuracy": 0.9290322580645162,
+    "eval_loss": 0.2266511768102646,
+    "eval_runtime": 13.6046,
+    "eval_samples_per_second": 11.393,
+    "eval_steps_per_second": 0.735
 }

test_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 7.113333333333333,
-    "eval_accuracy": 0.9548387096774194,
-    "eval_loss": 0.1593276411294937,
-    "eval_runtime": 16.3684,
-    "eval_samples_per_second": 9.469,
-    "eval_steps_per_second": 1.222
 }

 {
+    "epoch": 7.101351351351352,
+    "eval_accuracy": 0.9290322580645162,
+    "eval_loss": 0.2266511768102646,
+    "eval_runtime": 13.6046,
+    "eval_samples_per_second": 11.393,
+    "eval_steps_per_second": 0.735
 }

trainer_state.json CHANGED Viewed

@@ -1,325 +1,213 @@
 {
-  "best_metric": 0.9714285714285714,
-  "best_model_checkpoint": "videomae-base-finetuned-ucf101-subset/checkpoint-300",
-  "epoch": 7.113333333333333,
   "eval_steps": 500,
-  "global_step": 300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.03333333333333333,
-      "grad_norm": 6.439655780792236,
-      "learning_rate": 1.6666666666666667e-05,
-      "loss": 2.3256,
       "step": 10
     },
     {
-      "epoch": 0.06666666666666667,
-      "grad_norm": 6.954097270965576,
-      "learning_rate": 3.3333333333333335e-05,
-      "loss": 2.2799,
       "step": 20
     },
     {
-      "epoch": 0.1,
-      "grad_norm": 7.330563068389893,
-      "learning_rate": 5e-05,
-      "loss": 2.2089,
       "step": 30
     },
     {
-      "epoch": 0.12666666666666668,
-      "eval_accuracy": 0.5571428571428572,
-      "eval_loss": 1.9672648906707764,
-      "eval_runtime": 8.9839,
-      "eval_samples_per_second": 7.792,
-      "eval_steps_per_second": 1.002,
       "step": 38
     },
     {
-      "epoch": 1.0066666666666666,
-      "grad_norm": 8.947251319885254,
-      "learning_rate": 4.814814814814815e-05,
-      "loss": 2.1083,
       "step": 40
     },
     {
-      "epoch": 1.04,
-      "grad_norm": 10.695717811584473,
-      "learning_rate": 4.62962962962963e-05,
-      "loss": 1.6875,
       "step": 50
     },
     {
-      "epoch": 1.0733333333333333,
-      "grad_norm": 10.43160343170166,
-      "learning_rate": 4.4444444444444447e-05,
-      "loss": 1.4401,
       "step": 60
     },
     {
-      "epoch": 1.1066666666666667,
-      "grad_norm": 7.0906219482421875,
-      "learning_rate": 4.259259259259259e-05,
-      "loss": 0.9255,
       "step": 70
     },
     {
-      "epoch": 1.1266666666666667,
-      "eval_accuracy": 0.7142857142857143,
-      "eval_loss": 0.9603942036628723,
-      "eval_runtime": 7.6642,
-      "eval_samples_per_second": 9.133,
-      "eval_steps_per_second": 1.174,
       "step": 76
     },
     {
-      "epoch": 2.013333333333333,
-      "grad_norm": 7.673371315002441,
-      "learning_rate": 4.074074074074074e-05,
-      "loss": 0.905,
       "step": 80
     },
     {
-      "epoch": 2.046666666666667,
-      "grad_norm": 6.490078926086426,
-      "learning_rate": 3.888888888888889e-05,
-      "loss": 0.6113,
       "step": 90
     },
     {
-      "epoch": 2.08,
-      "grad_norm": 13.964165687561035,
-      "learning_rate": 3.7037037037037037e-05,
-      "loss": 0.5379,
       "step": 100
     },
     {
-      "epoch": 2.1133333333333333,
-      "grad_norm": 5.957258224487305,
-      "learning_rate": 3.518518518518519e-05,
-      "loss": 0.4511,
       "step": 110
     },
     {
-      "epoch": 2.1266666666666665,
-      "eval_accuracy": 0.7428571428571429,
-      "eval_loss": 0.5807345509529114,
-      "eval_runtime": 8.3663,
-      "eval_samples_per_second": 8.367,
-      "eval_steps_per_second": 1.076,
       "step": 114
     },
     {
-      "epoch": 3.02,
-      "grad_norm": 4.369177341461182,
-      "learning_rate": 3.3333333333333335e-05,
-      "loss": 0.2852,
       "step": 120
     },
     {
-      "epoch": 3.0533333333333332,
-      "grad_norm": 2.6237568855285645,
-      "learning_rate": 3.148148148148148e-05,
-      "loss": 0.2286,
       "step": 130
     },
     {
-      "epoch": 3.086666666666667,
-      "grad_norm": 5.644320964813232,
-      "learning_rate": 2.962962962962963e-05,
-      "loss": 0.2827,
-      "step": 140
-    },
-    {
-      "epoch": 3.12,
-      "grad_norm": 11.105957984924316,
-      "learning_rate": 2.777777777777778e-05,
-      "loss": 0.2102,
-      "step": 150
-    },
-    {
-      "epoch": 3.1266666666666665,
-      "eval_accuracy": 0.8857142857142857,
-      "eval_loss": 0.33364787697792053,
-      "eval_runtime": 6.7638,
-      "eval_samples_per_second": 10.349,
-      "eval_steps_per_second": 1.331,
-      "step": 152
-    },
-    {
-      "epoch": 4.026666666666666,
-      "grad_norm": 3.0925567150115967,
-      "learning_rate": 2.5925925925925925e-05,
-      "loss": 0.3526,
-      "step": 160
-    },
-    {
-      "epoch": 4.06,
-      "grad_norm": 2.3389172554016113,
-      "learning_rate": 2.4074074074074074e-05,
-      "loss": 0.3044,
-      "step": 170
-    },
-    {
-      "epoch": 4.093333333333334,
-      "grad_norm": 15.626021385192871,
-      "learning_rate": 2.2222222222222223e-05,
-      "loss": 0.1253,
-      "step": 180
-    },
-    {
-      "epoch": 4.126666666666667,
-      "grad_norm": 26.906152725219727,
-      "learning_rate": 2.037037037037037e-05,
-      "loss": 0.0994,
-      "step": 190
-    },
-    {
-      "epoch": 4.126666666666667,
-      "eval_accuracy": 0.9571428571428572,
-      "eval_loss": 0.13536687195301056,
-      "eval_runtime": 7.4727,
-      "eval_samples_per_second": 9.367,
-      "eval_steps_per_second": 1.204,
-      "step": 190
-    },
-    {
-      "epoch": 5.033333333333333,
-      "grad_norm": 0.45196783542633057,
-      "learning_rate": 1.8518518518518518e-05,
-      "loss": 0.1249,
-      "step": 200
-    },
-    {
-      "epoch": 5.066666666666666,
-      "grad_norm": 1.2230411767959595,
-      "learning_rate": 1.6666666666666667e-05,
-      "loss": 0.0302,
-      "step": 210
-    },
-    {
-      "epoch": 5.1,
-      "grad_norm": 0.2508547604084015,
-      "learning_rate": 1.4814814814814815e-05,
-      "loss": 0.1416,
-      "step": 220
-    },
-    {
-      "epoch": 5.126666666666667,
       "eval_accuracy": 0.9,
-      "eval_loss": 0.2323966920375824,
-      "eval_runtime": 7.8724,
-      "eval_samples_per_second": 8.892,
-      "eval_steps_per_second": 1.143,
-      "step": 228
-    },
-    {
-      "epoch": 6.006666666666667,
-      "grad_norm": 0.1509472280740738,
-      "learning_rate": 1.2962962962962962e-05,
-      "loss": 0.056,
-      "step": 230
     },
     {
-      "epoch": 6.04,
-      "grad_norm": 17.42368507385254,
-      "learning_rate": 1.1111111111111112e-05,
-      "loss": 0.1302,
-      "step": 240
-    },
-    {
-      "epoch": 6.073333333333333,
-      "grad_norm": 0.16968391835689545,
-      "learning_rate": 9.259259259259259e-06,
-      "loss": 0.0488,
-      "step": 250
-    },
-    {
-      "epoch": 6.1066666666666665,
-      "grad_norm": 0.1539120376110077,
-      "learning_rate": 7.4074074074074075e-06,
-      "loss": 0.0301,
-      "step": 260
-    },
-    {
-      "epoch": 6.126666666666667,
-      "eval_accuracy": 0.9428571428571428,
-      "eval_loss": 0.17422690987586975,
-      "eval_runtime": 8.163,
-      "eval_samples_per_second": 8.575,
-      "eval_steps_per_second": 1.103,
-      "step": 266
-    },
-    {
-      "epoch": 7.013333333333334,
-      "grad_norm": 0.12634336948394775,
-      "learning_rate": 5.555555555555556e-06,
-      "loss": 0.0144,
-      "step": 270
-    },
-    {
-      "epoch": 7.046666666666667,
-      "grad_norm": 0.1565423160791397,
-      "learning_rate": 3.7037037037037037e-06,
-      "loss": 0.0141,
-      "step": 280
-    },
-    {
-      "epoch": 7.08,
-      "grad_norm": 0.09596653282642365,
-      "learning_rate": 1.8518518518518519e-06,
-      "loss": 0.0144,
-      "step": 290
-    },
-    {
-      "epoch": 7.113333333333333,
-      "grad_norm": 0.09075827151536942,
-      "learning_rate": 0.0,
-      "loss": 0.023,
-      "step": 300
-    },
-    {
-      "epoch": 7.113333333333333,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.0840597078204155,
-      "eval_runtime": 7.7829,
-      "eval_samples_per_second": 8.994,
-      "eval_steps_per_second": 1.156,
-      "step": 300
-    },
-    {
-      "epoch": 7.113333333333333,
-      "step": 300,
-      "total_flos": 2.955876078527447e+18,
-      "train_loss": 0.5999104872345924,
-      "train_runtime": 483.0932,
-      "train_samples_per_second": 4.968,
-      "train_steps_per_second": 0.621
-    },
-    {
-      "epoch": 7.113333333333333,
-      "eval_accuracy": 0.9548387096774194,
-      "eval_loss": 0.15970781445503235,
-      "eval_runtime": 18.7889,
-      "eval_samples_per_second": 8.25,
-      "eval_steps_per_second": 1.064,
-      "step": 300
     },
     {
-      "epoch": 7.113333333333333,
-      "eval_accuracy": 0.9548387096774194,
-      "eval_loss": 0.1593276411294937,
-      "eval_runtime": 16.3684,
-      "eval_samples_per_second": 9.469,
-      "eval_steps_per_second": 1.222,
-      "step": 300
     }
   ],
   "logging_steps": 10,
-  "max_steps": 300,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 9223372036854775807,
   "save_steps": 500,
@@ -335,8 +223,8 @@
       "attributes": {}
     }
   },
-  "total_flos": 2.955876078527447e+18,
-  "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9142857142857143,
+  "best_model_checkpoint": "videomae-base-finetuned-ucf101-subset/checkpoint-148",
+  "epoch": 7.101351351351352,
   "eval_steps": 500,
+  "global_step": 148,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.06756756756756757,
+      "grad_norm": 6.34252405166626,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 2.0466,
       "step": 10
     },
     {
+      "epoch": 0.12837837837837837,
+      "eval_accuracy": 0.6142857142857143,
+      "eval_loss": 1.6348506212234497,
+      "eval_runtime": 6.1663,
+      "eval_samples_per_second": 11.352,
+      "eval_steps_per_second": 0.811,
+      "step": 19
+    },
+    {
+      "epoch": 1.0067567567567568,
+      "grad_norm": 7.780186176300049,
+      "learning_rate": 4.81203007518797e-05,
+      "loss": 1.8425,
       "step": 20
     },
     {
+      "epoch": 1.0743243243243243,
+      "grad_norm": 7.907790184020996,
+      "learning_rate": 4.43609022556391e-05,
+      "loss": 1.348,
       "step": 30
     },
     {
+      "epoch": 1.1283783783783783,
+      "eval_accuracy": 0.8428571428571429,
+      "eval_loss": 0.804053783416748,
+      "eval_runtime": 6.6922,
+      "eval_samples_per_second": 10.46,
+      "eval_steps_per_second": 0.747,
       "step": 38
     },
     {
+      "epoch": 2.0135135135135136,
+      "grad_norm": 5.862756729125977,
+      "learning_rate": 4.0601503759398494e-05,
+      "loss": 0.8369,
       "step": 40
     },
     {
+      "epoch": 2.081081081081081,
+      "grad_norm": 5.44201135635376,
+      "learning_rate": 3.6842105263157895e-05,
+      "loss": 0.6208,
       "step": 50
     },
     {
+      "epoch": 2.1283783783783785,
+      "eval_accuracy": 0.7285714285714285,
+      "eval_loss": 0.7582912445068359,
+      "eval_runtime": 6.1646,
+      "eval_samples_per_second": 11.355,
+      "eval_steps_per_second": 0.811,
+      "step": 57
+    },
+    {
+      "epoch": 3.02027027027027,
+      "grad_norm": 12.206607818603516,
+      "learning_rate": 3.3082706766917295e-05,
+      "loss": 0.5199,
       "step": 60
     },
     {
+      "epoch": 3.0878378378378377,
+      "grad_norm": 5.501271724700928,
+      "learning_rate": 2.9323308270676693e-05,
+      "loss": 0.332,
       "step": 70
     },
     {
+      "epoch": 3.1283783783783785,
+      "eval_accuracy": 0.8285714285714286,
+      "eval_loss": 0.45565441250801086,
+      "eval_runtime": 6.0418,
+      "eval_samples_per_second": 11.586,
+      "eval_steps_per_second": 0.828,
       "step": 76
     },
     {
+      "epoch": 4.027027027027027,
+      "grad_norm": 7.0609965324401855,
+      "learning_rate": 2.556390977443609e-05,
+      "loss": 0.2761,
       "step": 80
     },
     {
+      "epoch": 4.094594594594595,
+      "grad_norm": 3.5807061195373535,
+      "learning_rate": 2.1804511278195487e-05,
+      "loss": 0.2229,
       "step": 90
     },
     {
+      "epoch": 4.128378378378378,
+      "eval_accuracy": 0.8857142857142857,
+      "eval_loss": 0.3132798373699188,
+      "eval_runtime": 6.754,
+      "eval_samples_per_second": 10.364,
+      "eval_steps_per_second": 0.74,
+      "step": 95
+    },
+    {
+      "epoch": 5.033783783783784,
+      "grad_norm": 1.8226597309112549,
+      "learning_rate": 1.8045112781954888e-05,
+      "loss": 0.2292,
       "step": 100
     },
     {
+      "epoch": 5.101351351351352,
+      "grad_norm": 6.401218414306641,
+      "learning_rate": 1.4285714285714285e-05,
+      "loss": 0.1479,
       "step": 110
     },
     {
+      "epoch": 5.128378378378378,
+      "eval_accuracy": 0.9,
+      "eval_loss": 0.2872016131877899,
+      "eval_runtime": 5.5369,
+      "eval_samples_per_second": 12.643,
+      "eval_steps_per_second": 0.903,
       "step": 114
     },
     {
+      "epoch": 6.04054054054054,
+      "grad_norm": 4.436432361602783,
+      "learning_rate": 1.0526315789473684e-05,
+      "loss": 0.0848,
       "step": 120
     },
     {
+      "epoch": 6.108108108108108,
+      "grad_norm": 1.9256197214126587,
+      "learning_rate": 6.766917293233083e-06,
+      "loss": 0.0761,
       "step": 130
     },
     {
+      "epoch": 6.128378378378378,
       "eval_accuracy": 0.9,
+      "eval_loss": 0.28876611590385437,
+      "eval_runtime": 6.7507,
+      "eval_samples_per_second": 10.369,
+      "eval_steps_per_second": 0.741,
+      "step": 133
     },
     {
+      "epoch": 7.047297297297297,
+      "grad_norm": 7.098940372467041,
+      "learning_rate": 3.007518796992481e-06,
+      "loss": 0.0696,
+      "step": 140
     },
     {
+      "epoch": 7.101351351351352,
+      "eval_accuracy": 0.9142857142857143,
+      "eval_loss": 0.26643699407577515,
+      "eval_runtime": 6.7738,
+      "eval_samples_per_second": 10.334,
+      "eval_steps_per_second": 0.738,
+      "step": 148
+    },
+    {
+      "epoch": 7.101351351351352,
+      "step": 148,
+      "total_flos": 2.915999166844109e+18,
+      "train_loss": 0.5872005439690642,
+      "train_runtime": 676.4093,
+      "train_samples_per_second": 3.501,
+      "train_steps_per_second": 0.219
+    },
+    {
+      "epoch": 7.101351351351352,
+      "eval_accuracy": 0.9290322580645162,
+      "eval_loss": 0.2252088487148285,
+      "eval_runtime": 13.824,
+      "eval_samples_per_second": 11.212,
+      "eval_steps_per_second": 0.723,
+      "step": 148
+    },
+    {
+      "epoch": 7.101351351351352,
+      "eval_accuracy": 0.9290322580645162,
+      "eval_loss": 0.2266511768102646,
+      "eval_runtime": 13.6046,
+      "eval_samples_per_second": 11.393,
+      "eval_steps_per_second": 0.735,
+      "step": 148
     }
   ],
   "logging_steps": 10,
+  "max_steps": 148,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 9223372036854775807,
   "save_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 2.915999166844109e+18,
+  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }