Training in progress, epoch 0

Files changed (6) hide show

adapter_config.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "alpha_pattern": {},
   "auto_mapping": null,
-  "base_model_name_or_path": "alignment-handbook/zephyr-7b-sft-full",
   "bias": "none",
   "fan_in_fan_out": false,
   "inference_mode": true,
@@ -16,10 +16,10 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "q_proj",
-    "k_proj",
     "v_proj",
-    "o_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

 {
   "alpha_pattern": {},
   "auto_mapping": null,
+  "base_model_name_or_path": "mistralai/Mistral-7B-v0.1",
   "bias": "none",
   "fan_in_fan_out": false,
   "inference_mode": true,
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "v_proj",
+    "o_proj",
+    "k_proj",
+    "q_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:df7c66b2ac34303827d857d3d4c0b6dffe70d61b1d97fa62cb2a93d5af147460
-size 218138576

 version https://git-lfs.github.com/spec/v1
+oid sha256:8871811ad1829b0923b3045a3284f49bcafa69b38137e8e095f39d13b1e437b1
+size 109086672

all_results.json CHANGED Viewed

@@ -1,21 +1,8 @@
 {
-    "epoch": 3.0,
-    "eval_logits/chosen": -2.0662753582000732,
-    "eval_logits/rejected": -1.9411602020263672,
-    "eval_logps/chosen": -266.15380859375,
-    "eval_logps/rejected": -228.28196716308594,
-    "eval_loss": 0.5263338685035706,
-    "eval_rewards/accuracies": 0.7480000257492065,
-    "eval_rewards/chosen": -0.14929771423339844,
-    "eval_rewards/margins": 0.7504671812057495,
-    "eval_rewards/rejected": -0.899764895439148,
-    "eval_runtime": 443.1683,
-    "eval_samples": 2000,
-    "eval_samples_per_second": 4.513,
-    "eval_steps_per_second": 0.282,
-    "train_loss": 0.5640471254170105,
-    "train_runtime": 84492.9354,
     "train_samples": 61966,
-    "train_samples_per_second": 2.2,
-    "train_steps_per_second": 0.034
 }

 {
+    "epoch": 1.0,
+    "train_loss": 0.6731863415930882,
+    "train_runtime": 27311.2139,
     "train_samples": 61966,
+    "train_samples_per_second": 2.269,
+    "train_steps_per_second": 0.035
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 3.0,
-    "train_loss": 0.5640471254170105,
-    "train_runtime": 84492.9354,
     "train_samples": 61966,
-    "train_samples_per_second": 2.2,
-    "train_steps_per_second": 0.034
 }

 {
+    "epoch": 1.0,
+    "train_loss": 0.6731863415930882,
+    "train_runtime": 27311.2139,
     "train_samples": 61966,
+    "train_samples_per_second": 2.269,
+    "train_steps_per_second": 0.035
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9fc66c772c0a45fc2b3937369ccc3768508ec3d91869b201909e9cda99c3c455
 size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:0cdefb077695dcf29ef41f5fe1cec41780efc249a1ae6388bcd274fd33ef9945
 size 4792