Model save

Files changed (6) hide show

adapter_config.json CHANGED Viewed

@@ -20,13 +20,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "q_proj",
-    "o_proj",
     "gate_proj",
     "k_proj",
-    "down_proj",
     "up_proj",
-    "v_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "v_proj",
     "gate_proj",
     "k_proj",
     "up_proj",
+    "o_proj",
+    "q_proj",
+    "down_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

all_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 1.0,
     "total_flos": 5.19321114598441e+16,
-    "train_loss": 0.29640919991901943,
-    "train_runtime": 283.2891,
     "train_samples": 9000,
-    "train_samples_per_second": 1.966,
-    "train_steps_per_second": 0.124
 }

 {
     "epoch": 1.0,
     "total_flos": 5.19321114598441e+16,
+    "train_loss": 0.0,
+    "train_runtime": 0.0101,
     "train_samples": 9000,
+    "train_samples_per_second": 54933.863,
+    "train_steps_per_second": 3451.859
 }

runs/Nov28_06-32-21_RLHF000/events.out.tfevents.1732775550.RLHF000.96163.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f439e3132d286dc02122dd87645020e0d87963d802f2476664d634e71bc87e0
+size 7260

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 1.0,
     "total_flos": 5.19321114598441e+16,
-    "train_loss": 0.29640919991901943,
-    "train_runtime": 283.2891,
     "train_samples": 9000,
-    "train_samples_per_second": 1.966,
-    "train_steps_per_second": 0.124
 }

 {
     "epoch": 1.0,
     "total_flos": 5.19321114598441e+16,
+    "train_loss": 0.0,
+    "train_runtime": 0.0101,
     "train_samples": 9000,
+    "train_samples_per_second": 54933.863,
+    "train_steps_per_second": 3451.859
 }

trainer_state.json CHANGED Viewed

@@ -64,22 +64,14 @@
       "loss": 0.1105,
       "step": 35
     },
-    {
-      "epoch": 1.0,
-      "eval_loss": 0.11027031391859055,
-      "eval_runtime": 9.0841,
-      "eval_samples_per_second": 6.715,
-      "eval_steps_per_second": 0.44,
-      "step": 35
-    },
     {
       "epoch": 1.0,
       "step": 35,
       "total_flos": 5.19321114598441e+16,
-      "train_loss": 0.29640919991901943,
-      "train_runtime": 283.2891,
-      "train_samples_per_second": 1.966,
-      "train_steps_per_second": 0.124
     }
   ],
   "logging_steps": 5,

       "loss": 0.1105,
       "step": 35
     },
     {
       "epoch": 1.0,
       "step": 35,
       "total_flos": 5.19321114598441e+16,
+      "train_loss": 0.0,
+      "train_runtime": 0.0101,
+      "train_samples_per_second": 54933.863,
+      "train_steps_per_second": 3451.859
     }
   ],
   "logging_steps": 5,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3f15a816755935c765d06466ad254b6b1fc53c7fad1a2d6152c2acfb2e238d7a
 size 6328

 version https://git-lfs.github.com/spec/v1
+oid sha256:91b5a4eaa042445efe6b2a06ce6686184fbd6b4858ba94e63f557be79d5dde1e
 size 6328