End of training

Browse files

Files changed (3) hide show

all_results.json +8 -0
test_results.json +8 -0
trainer_state.json +424 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 29.03,
+    "eval_accuracy": 0.9032258064516129,
+    "eval_loss": 0.4718249440193176,
+    "eval_runtime": 80.7097,
+    "eval_samples_per_second": 0.384,
+    "eval_steps_per_second": 0.05
+}

test_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 29.03,
+    "eval_accuracy": 0.9032258064516129,
+    "eval_loss": 0.4718249440193176,
+    "eval_runtime": 80.7097,
+    "eval_samples_per_second": 0.384,
+    "eval_steps_per_second": 0.05
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,424 @@

+{
+  "best_metric": 0.92,
+  "best_model_checkpoint": "finetuned-Accident-Video-subsetv2/checkpoint-150",
+  "epoch": 29.033333333333335,
+  "eval_steps": 500,
+  "global_step": 180,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.03,
+      "eval_accuracy": 0.08,
+      "eval_loss": 1.6174906492233276,
+      "eval_runtime": 74.2855,
+      "eval_samples_per_second": 0.337,
+      "eval_steps_per_second": 0.054,
+      "step": 6
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 1.5831,
+      "step": 10
+    },
+    {
+      "epoch": 1.03,
+      "eval_accuracy": 0.52,
+      "eval_loss": 1.372893214225769,
+      "eval_runtime": 78.0357,
+      "eval_samples_per_second": 0.32,
+      "eval_steps_per_second": 0.051,
+      "step": 12
+    },
+    {
+      "epoch": 2.03,
+      "eval_accuracy": 0.52,
+      "eval_loss": 1.1953624486923218,
+      "eval_runtime": 78.5221,
+      "eval_samples_per_second": 0.318,
+      "eval_steps_per_second": 0.051,
+      "step": 18
+    },
+    {
+      "epoch": 3.01,
+      "learning_rate": 4.938271604938271e-05,
+      "loss": 1.3037,
+      "step": 20
+    },
+    {
+      "epoch": 3.03,
+      "eval_accuracy": 0.48,
+      "eval_loss": 1.176283597946167,
+      "eval_runtime": 74.6832,
+      "eval_samples_per_second": 0.335,
+      "eval_steps_per_second": 0.054,
+      "step": 24
+    },
+    {
+      "epoch": 4.03,
+      "learning_rate": 4.62962962962963e-05,
+      "loss": 1.1833,
+      "step": 30
+    },
+    {
+      "epoch": 4.03,
+      "eval_accuracy": 0.52,
+      "eval_loss": 1.1420832872390747,
+      "eval_runtime": 59.4182,
+      "eval_samples_per_second": 0.421,
+      "eval_steps_per_second": 0.067,
+      "step": 30
+    },
+    {
+      "epoch": 5.03,
+      "eval_accuracy": 0.52,
+      "eval_loss": 1.1220537424087524,
+      "eval_runtime": 59.6408,
+      "eval_samples_per_second": 0.419,
+      "eval_steps_per_second": 0.067,
+      "step": 36
+    },
+    {
+      "epoch": 6.02,
+      "learning_rate": 4.3209876543209875e-05,
+      "loss": 1.125,
+      "step": 40
+    },
+    {
+      "epoch": 6.03,
+      "eval_accuracy": 0.68,
+      "eval_loss": 1.0468703508377075,
+      "eval_runtime": 59.1225,
+      "eval_samples_per_second": 0.423,
+      "eval_steps_per_second": 0.068,
+      "step": 42
+    },
+    {
+      "epoch": 7.03,
+      "eval_accuracy": 0.6,
+      "eval_loss": 1.0552805662155151,
+      "eval_runtime": 61.9333,
+      "eval_samples_per_second": 0.404,
+      "eval_steps_per_second": 0.065,
+      "step": 48
+    },
+    {
+      "epoch": 8.01,
+      "learning_rate": 4.012345679012346e-05,
+      "loss": 1.0967,
+      "step": 50
+    },
+    {
+      "epoch": 8.03,
+      "eval_accuracy": 0.72,
+      "eval_loss": 0.9645193219184875,
+      "eval_runtime": 59.8316,
+      "eval_samples_per_second": 0.418,
+      "eval_steps_per_second": 0.067,
+      "step": 54
+    },
+    {
+      "epoch": 9.03,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 1.0025,
+      "step": 60
+    },
+    {
+      "epoch": 9.03,
+      "eval_accuracy": 0.6,
+      "eval_loss": 0.9435223340988159,
+      "eval_runtime": 60.4105,
+      "eval_samples_per_second": 0.414,
+      "eval_steps_per_second": 0.066,
+      "step": 60
+    },
+    {
+      "epoch": 10.03,
+      "eval_accuracy": 0.76,
+      "eval_loss": 0.8497534990310669,
+      "eval_runtime": 70.118,
+      "eval_samples_per_second": 0.357,
+      "eval_steps_per_second": 0.057,
+      "step": 66
+    },
+    {
+      "epoch": 11.02,
+      "learning_rate": 3.395061728395062e-05,
+      "loss": 0.9207,
+      "step": 70
+    },
+    {
+      "epoch": 11.03,
+      "eval_accuracy": 0.72,
+      "eval_loss": 0.8095592260360718,
+      "eval_runtime": 68.7785,
+      "eval_samples_per_second": 0.363,
+      "eval_steps_per_second": 0.058,
+      "step": 72
+    },
+    {
+      "epoch": 12.03,
+      "eval_accuracy": 0.68,
+      "eval_loss": 0.8176926374435425,
+      "eval_runtime": 68.3666,
+      "eval_samples_per_second": 0.366,
+      "eval_steps_per_second": 0.059,
+      "step": 78
+    },
+    {
+      "epoch": 13.01,
+      "learning_rate": 3.08641975308642e-05,
+      "loss": 0.7994,
+      "step": 80
+    },
+    {
+      "epoch": 13.03,
+      "eval_accuracy": 0.64,
+      "eval_loss": 0.7237111926078796,
+      "eval_runtime": 67.4729,
+      "eval_samples_per_second": 0.371,
+      "eval_steps_per_second": 0.059,
+      "step": 84
+    },
+    {
+      "epoch": 14.03,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.753,
+      "step": 90
+    },
+    {
+      "epoch": 14.03,
+      "eval_accuracy": 0.72,
+      "eval_loss": 0.6827337741851807,
+      "eval_runtime": 67.0259,
+      "eval_samples_per_second": 0.373,
+      "eval_steps_per_second": 0.06,
+      "step": 90
+    },
+    {
+      "epoch": 15.03,
+      "eval_accuracy": 0.88,
+      "eval_loss": 0.5696862936019897,
+      "eval_runtime": 69.113,
+      "eval_samples_per_second": 0.362,
+      "eval_steps_per_second": 0.058,
+      "step": 96
+    },
+    {
+      "epoch": 16.02,
+      "learning_rate": 2.4691358024691357e-05,
+      "loss": 0.6998,
+      "step": 100
+    },
+    {
+      "epoch": 16.03,
+      "eval_accuracy": 0.76,
+      "eval_loss": 0.7594789266586304,
+      "eval_runtime": 68.4666,
+      "eval_samples_per_second": 0.365,
+      "eval_steps_per_second": 0.058,
+      "step": 102
+    },
+    {
+      "epoch": 17.03,
+      "eval_accuracy": 0.88,
+      "eval_loss": 0.5631096363067627,
+      "eval_runtime": 68.5985,
+      "eval_samples_per_second": 0.364,
+      "eval_steps_per_second": 0.058,
+      "step": 108
+    },
+    {
+      "epoch": 18.01,
+      "learning_rate": 2.1604938271604937e-05,
+      "loss": 0.6564,
+      "step": 110
+    },
+    {
+      "epoch": 18.03,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.5146105885505676,
+      "eval_runtime": 64.7403,
+      "eval_samples_per_second": 0.386,
+      "eval_steps_per_second": 0.062,
+      "step": 114
+    },
+    {
+      "epoch": 19.03,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.5929,
+      "step": 120
+    },
+    {
+      "epoch": 19.03,
+      "eval_accuracy": 0.6,
+      "eval_loss": 0.7956848740577698,
+      "eval_runtime": 79.3384,
+      "eval_samples_per_second": 0.315,
+      "eval_steps_per_second": 0.05,
+      "step": 120
+    },
+    {
+      "epoch": 20.03,
+      "eval_accuracy": 0.88,
+      "eval_loss": 0.5254407525062561,
+      "eval_runtime": 63.7552,
+      "eval_samples_per_second": 0.392,
+      "eval_steps_per_second": 0.063,
+      "step": 126
+    },
+    {
+      "epoch": 21.02,
+      "learning_rate": 1.54320987654321e-05,
+      "loss": 0.5148,
+      "step": 130
+    },
+    {
+      "epoch": 21.03,
+      "eval_accuracy": 0.88,
+      "eval_loss": 0.4102124273777008,
+      "eval_runtime": 65.1408,
+      "eval_samples_per_second": 0.384,
+      "eval_steps_per_second": 0.061,
+      "step": 132
+    },
+    {
+      "epoch": 22.03,
+      "eval_accuracy": 0.88,
+      "eval_loss": 0.4555157721042633,
+      "eval_runtime": 65.856,
+      "eval_samples_per_second": 0.38,
+      "eval_steps_per_second": 0.061,
+      "step": 138
+    },
+    {
+      "epoch": 23.01,
+      "learning_rate": 1.2345679012345678e-05,
+      "loss": 0.3351,
+      "step": 140
+    },
+    {
+      "epoch": 23.03,
+      "eval_accuracy": 0.72,
+      "eval_loss": 0.773196280002594,
+      "eval_runtime": 70.5357,
+      "eval_samples_per_second": 0.354,
+      "eval_steps_per_second": 0.057,
+      "step": 144
+    },
+    {
+      "epoch": 24.03,
+      "learning_rate": 9.259259259259259e-06,
+      "loss": 0.4489,
+      "step": 150
+    },
+    {
+      "epoch": 24.03,
+      "eval_accuracy": 0.92,
+      "eval_loss": 0.4464223086833954,
+      "eval_runtime": 67.1272,
+      "eval_samples_per_second": 0.372,
+      "eval_steps_per_second": 0.06,
+      "step": 150
+    },
+    {
+      "epoch": 25.03,
+      "eval_accuracy": 0.92,
+      "eval_loss": 0.3872789144515991,
+      "eval_runtime": 67.9637,
+      "eval_samples_per_second": 0.368,
+      "eval_steps_per_second": 0.059,
+      "step": 156
+    },
+    {
+      "epoch": 26.02,
+      "learning_rate": 6.172839506172839e-06,
+      "loss": 0.3652,
+      "step": 160
+    },
+    {
+      "epoch": 26.03,
+      "eval_accuracy": 0.92,
+      "eval_loss": 0.3817351460456848,
+      "eval_runtime": 67.6243,
+      "eval_samples_per_second": 0.37,
+      "eval_steps_per_second": 0.059,
+      "step": 162
+    },
+    {
+      "epoch": 27.03,
+      "eval_accuracy": 0.92,
+      "eval_loss": 0.39160746335983276,
+      "eval_runtime": 67.5822,
+      "eval_samples_per_second": 0.37,
+      "eval_steps_per_second": 0.059,
+      "step": 168
+    },
+    {
+      "epoch": 28.01,
+      "learning_rate": 3.0864197530864196e-06,
+      "loss": 0.2532,
+      "step": 170
+    },
+    {
+      "epoch": 28.03,
+      "eval_accuracy": 0.92,
+      "eval_loss": 0.39454135298728943,
+      "eval_runtime": 63.3977,
+      "eval_samples_per_second": 0.394,
+      "eval_steps_per_second": 0.063,
+      "step": 174
+    },
+    {
+      "epoch": 29.03,
+      "learning_rate": 0.0,
+      "loss": 0.1712,
+      "step": 180
+    },
+    {
+      "epoch": 29.03,
+      "eval_accuracy": 0.92,
+      "eval_loss": 0.39993801712989807,
+      "eval_runtime": 64.7389,
+      "eval_samples_per_second": 0.386,
+      "eval_steps_per_second": 0.062,
+      "step": 180
+    },
+    {
+      "epoch": 29.03,
+      "step": 180,
+      "total_flos": 1.682232201732096e+18,
+      "train_loss": 0.7669431573814816,
+      "train_runtime": 7558.2473,
+      "train_samples_per_second": 0.191,
+      "train_steps_per_second": 0.024
+    },
+    {
+      "epoch": 29.03,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_loss": 0.47182491421699524,
+      "eval_runtime": 77.6157,
+      "eval_samples_per_second": 0.399,
+      "eval_steps_per_second": 0.052,
+      "step": 180
+    },
+    {
+      "epoch": 29.03,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_loss": 0.4718249440193176,
+      "eval_runtime": 80.7097,
+      "eval_samples_per_second": 0.384,
+      "eval_steps_per_second": 0.05,
+      "step": 180
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 180,
+  "num_train_epochs": 9223372036854775807,
+  "save_steps": 500,
+  "total_flos": 1.682232201732096e+18,
+  "trial_name": null,
+  "trial_params": null
+}