chchen
/

Llama-3.1-8B-Instruct-PsyCourse-info-fold4

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7945b993b7287a158d573a1801d60f4b608d6b296a7479eeef92c415bda5fbb0
 size 83945296

 version https://git-lfs.github.com/spec/v1
+oid sha256:c75c7ee5d9b1db22567eef581ec356a298bfc9f24ccc56aa9f695f9a5b3e88a4
 size 83945296

trainer_log.jsonl CHANGED Viewed

@@ -119,3 +119,14 @@
 {"current_steps": 109, "total_steps": 125, "loss": 0.0943, "lr": 4.951556604879048e-06, "epoch": 4.306172839506173, "percentage": 87.2, "elapsed_time": "0:50:46", "remaining_time": "0:07:27"}
 {"current_steps": 110, "total_steps": 125, "loss": 0.0801, "lr": 4.360836746934055e-06, "epoch": 4.345679012345679, "percentage": 88.0, "elapsed_time": "0:51:11", "remaining_time": "0:06:58"}
 {"current_steps": 110, "total_steps": 125, "eval_loss": 0.1588951051235199, "epoch": 4.345679012345679, "percentage": 88.0, "elapsed_time": "0:51:32", "remaining_time": "0:07:01"}

 {"current_steps": 109, "total_steps": 125, "loss": 0.0943, "lr": 4.951556604879048e-06, "epoch": 4.306172839506173, "percentage": 87.2, "elapsed_time": "0:50:46", "remaining_time": "0:07:27"}
 {"current_steps": 110, "total_steps": 125, "loss": 0.0801, "lr": 4.360836746934055e-06, "epoch": 4.345679012345679, "percentage": 88.0, "elapsed_time": "0:51:11", "remaining_time": "0:06:58"}
 {"current_steps": 110, "total_steps": 125, "eval_loss": 0.1588951051235199, "epoch": 4.345679012345679, "percentage": 88.0, "elapsed_time": "0:51:32", "remaining_time": "0:07:01"}
+{"current_steps": 111, "total_steps": 125, "loss": 0.0776, "lr": 3.8060233744356633e-06, "epoch": 4.385185185185185, "percentage": 88.8, "elapsed_time": "0:52:03", "remaining_time": "0:06:34"}
+{"current_steps": 112, "total_steps": 125, "loss": 0.0686, "lr": 3.2875529852700147e-06, "epoch": 4.424691358024692, "percentage": 89.6, "elapsed_time": "0:52:30", "remaining_time": "0:06:05"}
+{"current_steps": 113, "total_steps": 125, "loss": 0.075, "lr": 2.8058334845816213e-06, "epoch": 4.4641975308641975, "percentage": 90.4, "elapsed_time": "0:52:54", "remaining_time": "0:05:37"}
+{"current_steps": 114, "total_steps": 125, "loss": 0.0712, "lr": 2.361243863855184e-06, "epoch": 4.503703703703704, "percentage": 91.2, "elapsed_time": "0:53:21", "remaining_time": "0:05:08"}
+{"current_steps": 115, "total_steps": 125, "loss": 0.0607, "lr": 1.9541339027450256e-06, "epoch": 4.54320987654321, "percentage": 92.0, "elapsed_time": "0:53:48", "remaining_time": "0:04:40"}
+{"current_steps": 116, "total_steps": 125, "loss": 0.077, "lr": 1.584823893886933e-06, "epoch": 4.582716049382716, "percentage": 92.8, "elapsed_time": "0:54:16", "remaining_time": "0:04:12"}
+{"current_steps": 117, "total_steps": 125, "loss": 0.0955, "lr": 1.2536043909088191e-06, "epoch": 4.622222222222222, "percentage": 93.6, "elapsed_time": "0:54:41", "remaining_time": "0:03:44"}
+{"current_steps": 118, "total_steps": 125, "loss": 0.0504, "lr": 9.607359798384785e-07, "epoch": 4.661728395061728, "percentage": 94.4, "elapsed_time": "0:55:04", "remaining_time": "0:03:16"}
+{"current_steps": 119, "total_steps": 125, "loss": 0.084, "lr": 7.064490740882057e-07, "epoch": 4.701234567901235, "percentage": 95.2, "elapsed_time": "0:55:32", "remaining_time": "0:02:48"}
+{"current_steps": 120, "total_steps": 125, "loss": 0.0932, "lr": 4.909437331777179e-07, "epoch": 4.7407407407407405, "percentage": 96.0, "elapsed_time": "0:55:57", "remaining_time": "0:02:19"}
+{"current_steps": 120, "total_steps": 125, "eval_loss": 0.15954476594924927, "epoch": 4.7407407407407405, "percentage": 96.0, "elapsed_time": "0:56:18", "remaining_time": "0:02:20"}