Epoch 2. Batch Size 0. Peers 10.

Files changed (4) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "distributed/optimized-gpt2-1b",
   "activation_function": "gelu_new",
   "all_reduce_scores": {
     "0": "NON_PARTICIPATING",
@@ -160,7 +160,7 @@
     "238": "NON_PARTICIPATING",
     "239": "NON_PARTICIPATING",
     "24": "NON_PARTICIPATING",
-    "240": "NON_PARTICIPATING",
     "241": "NON_PARTICIPATING",
     "242": "NON_PARTICIPATING",
     "243": "NON_PARTICIPATING",
@@ -169,7 +169,7 @@
     "246": "NON_PARTICIPATING",
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
-    "249": "SUCCESS",
     "25": "SUCCESS",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
@@ -267,7 +267,13 @@
     "AutoConfig": "distributed/optimized-gpt2-500m--configuration_gpt_optimized.GPTOptimConfig",
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
-  "block_list": [],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
@@ -275,7 +281,7 @@
   "initializer_range": 0.02,
   "inner_step": 0,
   "inner_steps": 0,
-  "last_allreduce_block": 5263850,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

 {
+  "_name_or_path": "Mhair/onetwothree",
   "activation_function": "gelu_new",
   "all_reduce_scores": {
     "0": "NON_PARTICIPATING",
     "238": "NON_PARTICIPATING",
     "239": "NON_PARTICIPATING",
     "24": "NON_PARTICIPATING",
+    "240": "SUCCESS",
     "241": "NON_PARTICIPATING",
     "242": "NON_PARTICIPATING",
     "243": "NON_PARTICIPATING",
     "246": "NON_PARTICIPATING",
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
+    "249": "NON_PARTICIPATING",
     "25": "SUCCESS",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
     "AutoConfig": "distributed/optimized-gpt2-500m--configuration_gpt_optimized.GPTOptimConfig",
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
+  "block_list": [
+    5064009,
+    5064013,
+    5064017,
+    5064021,
+    5064025
+  ],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "initializer_range": 0.02,
   "inner_step": 0,
   "inner_steps": 0,
+  "last_allreduce_block": 5265017,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

inner_optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:df2588b940f0bab6c967f7abc2a6ff9cd6bad6ed15bd3c1f94527dfc94cc3805
 size 2752

 version https://git-lfs.github.com/spec/v1
+oid sha256:b5f7b91e591ec147fc34a4b0d645772daee4b68d91c1416dff8233984a37df72
 size 2752

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c67ad117f2f7f4bd3c9a79975d5377ee48e62f9aef768b6db3f73540ec9ddc94
 size 4040701744

 version https://git-lfs.github.com/spec/v1
+oid sha256:8be83e1ea9c0eaeab2cecfdeae6e9617dae603fdfbeda43c55bc385455934a1f
 size 4040701744

outer_optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:594178c37b62f68916caadb4aa2773c13386ec40c58556f9d8192749316e4f20
 size 4040805354

 version https://git-lfs.github.com/spec/v1
+oid sha256:1dd3daddc2a7543570712cda9cc14833d6f09a833e09a76eb9f5a1ac0ba93eb2
 size 4040805354