End of training

Browse files

Files changed (15) hide show

README.md +31 -31
config.json +38 -18
final_checkpoint/config.json +38 -18
final_checkpoint/generation_config.json +3 -3
final_checkpoint/model-00001-of-00003.safetensors +2 -2
final_checkpoint/model-00002-of-00003.safetensors +2 -2
generation_config.json +3 -3
model-00001-of-00003.safetensors +2 -2
model-00002-of-00003.safetensors +2 -2
model-00003-of-00003.safetensors +2 -2
model.safetensors.index.json +195 -292
special_tokens_map.json +4 -4
tokenizer.json +0 -0
tokenizer_config.json +190 -21
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
 license: apache-2.0
-base_model: mistralai/Mistral-7B-Instruct-v0.1
 tags:
 - trl
 - dpo
@@ -15,17 +15,17 @@ should probably proofread and complete it, then remove this comment. -->
 # v1_1000_STEPS_1e6_rate_03_beta_DPO
-This model is a fine-tuned version of [mistralai/Mistral-7B-Instruct-v0.1](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.1) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.8487
-- Rewards/chosen: -2.2151
-- Rewards/rejected: -3.0240
-- Rewards/accuracies: 0.5758
-- Rewards/margins: 0.8089
-- Logps/rejected: -26.9594
-- Logps/chosen: -22.6366
-- Logits/rejected: -3.2869
-- Logits/chosen: -3.2870
 ## Model description
@@ -59,26 +59,26 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rewards/chosen | Rewards/rejected | Rewards/accuracies | Rewards/margins | Logps/rejected | Logps/chosen | Logits/rejected | Logits/chosen |
 |:-------------:|:-----:|:----:|:---------------:|:--------------:|:----------------:|:------------------:|:---------------:|:--------------:|:------------:|:---------------:|:-------------:|
-| 0.7016        | 0.05  | 50   | 0.6686          | -0.1010        | -0.1780          | 0.5516             | 0.0771          | -17.4730       | -15.5896     | -3.3830         | -3.3830       |
-| 0.6727        | 0.1   | 100  | 0.7732          | -1.2186        | -1.6229          | 0.5275             | 0.4043          | -22.2891       | -19.3150     | -3.3350         | -3.3352       |
-| 1.2098        | 0.15  | 150  | 0.9205          | -1.6685        | -2.0242          | 0.5209             | 0.3558          | -23.6270       | -20.8147     | -3.3998         | -3.4000       |
-| 0.8607        | 0.2   | 200  | 0.9312          | -1.7362        | -2.0915          | 0.5099             | 0.3553          | -23.8513       | -21.0405     | -3.3324         | -3.3326       |
-| 0.896         | 0.24  | 250  | 0.9765          | -1.8658        | -2.0921          | 0.5011             | 0.2263          | -23.8533       | -21.4723     | -3.2214         | -3.2215       |
-| 0.9783        | 0.29  | 300  | 0.9234          | -1.9658        | -2.3835          | 0.5165             | 0.4177          | -24.8244       | -21.8057     | -3.3158         | -3.3160       |
-| 1.0592        | 0.34  | 350  | 0.9509          | -3.1300        | -3.4037          | 0.5033             | 0.2738          | -28.2253       | -25.6863     | -3.2697         | -3.2698       |
-| 1.0391        | 0.39  | 400  | 0.9067          | -2.4562        | -2.8182          | 0.5231             | 0.3619          | -26.2735       | -23.4405     | -3.3616         | -3.3617       |
-| 0.9409        | 0.44  | 450  | 0.9081          | -2.8095        | -3.1865          | 0.5231             | 0.3771          | -27.5014       | -24.6179     | -3.3324         | -3.3325       |
-| 0.8139        | 0.49  | 500  | 0.9131          | -2.8071        | -3.2564          | 0.5560             | 0.4493          | -27.7343       | -24.6100     | -3.3362         | -3.3363       |
-| 0.8732        | 0.54  | 550  | 0.8745          | -2.3409        | -3.0357          | 0.5516             | 0.6948          | -26.9986       | -23.0562     | -3.3124         | -3.3125       |
-| 0.8179        | 0.59  | 600  | 0.8632          | -2.1460        | -2.9478          | 0.5692             | 0.8018          | -26.7055       | -22.4063     | -3.3039         | -3.3040       |
-| 0.825         | 0.64  | 650  | 0.8769          | -1.9605        | -2.7326          | 0.5626             | 0.7721          | -25.9882       | -21.7879     | -3.3006         | -3.3007       |
-| 0.7539        | 0.68  | 700  | 0.8600          | -2.1758        | -2.9531          | 0.5714             | 0.7773          | -26.7232       | -22.5059     | -3.2794         | -3.2795       |
-| 0.7835        | 0.73  | 750  | 0.8551          | -2.2525        | -3.0394          | 0.5692             | 0.7868          | -27.0107       | -22.7614     | -3.2905         | -3.2906       |
-| 0.925         | 0.78  | 800  | 0.8479          | -2.2131        | -3.0235          | 0.5736             | 0.8105          | -26.9579       | -22.6299     | -3.2902         | -3.2903       |
-| 1.0166        | 0.83  | 850  | 0.8493          | -2.2090        | -3.0157          | 0.5780             | 0.8067          | -26.9319       | -22.6164     | -3.2872         | -3.2873       |
-| 1.0711        | 0.88  | 900  | 0.8480          | -2.2126        | -3.0221          | 0.5758             | 0.8095          | -26.9532       | -22.6283     | -3.2869         | -3.2870       |
-| 0.9928        | 0.93  | 950  | 0.8487          | -2.2161        | -3.0255          | 0.5802             | 0.8094          | -26.9646       | -22.6400     | -3.2869         | -3.2870       |
-| 0.6707        | 0.98  | 1000 | 0.8487          | -2.2151        | -3.0240          | 0.5758             | 0.8089          | -26.9594       | -22.6366     | -3.2869         | -3.2870       |
 ### Framework versions

 ---
 license: apache-2.0
+base_model: mosaicml/mpt-7b-instruct
 tags:
 - trl
 - dpo
 # v1_1000_STEPS_1e6_rate_03_beta_DPO
+This model is a fine-tuned version of [mosaicml/mpt-7b-instruct](https://huggingface.co/mosaicml/mpt-7b-instruct) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.6641
+- Rewards/chosen: -1.4066
+- Rewards/rejected: -1.6576
+- Rewards/accuracies: 0.6198
+- Rewards/margins: 0.2510
+- Logps/rejected: -27.0829
+- Logps/chosen: -25.4808
+- Logits/rejected: 13.3887
+- Logits/chosen: 13.3921
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Rewards/chosen | Rewards/rejected | Rewards/accuracies | Rewards/margins | Logps/rejected | Logps/chosen | Logits/rejected | Logits/chosen |
 |:-------------:|:-----:|:----:|:---------------:|:--------------:|:----------------:|:------------------:|:---------------:|:--------------:|:------------:|:---------------:|:-------------:|
+| 0.6901        | 0.05  | 50   | 0.6931          | 0.0510         | 0.0490           | 0.5253             | 0.0019          | -21.3940       | -20.6223     | 14.3181         | 14.3207       |
+| 0.7257        | 0.1   | 100  | 0.6841          | 0.0934         | 0.0501           | 0.5692             | 0.0433          | -21.3906       | -20.4809     | 14.1613         | 14.1641       |
+| 0.7259        | 0.15  | 150  | 0.6925          | -0.0147        | -0.0834          | 0.5451             | 0.0688          | -21.8355       | -20.8411     | 13.9200         | 13.9229       |
+| 0.6593        | 0.2   | 200  | 0.7118          | 0.4903         | 0.3962           | 0.5802             | 0.0941          | -20.2368       | -19.1579     | 13.7791         | 13.7821       |
+| 0.7282        | 0.24  | 250  | 0.7093          | -1.2326        | -1.3686          | 0.5648             | 0.1360          | -26.1195       | -24.9010     | 13.8037         | 13.8067       |
+| 0.6924        | 0.29  | 300  | 0.6944          | -0.7898        | -0.9655          | 0.5626             | 0.1757          | -24.7758       | -23.4250     | 14.0496         | 14.0528       |
+| 0.7523        | 0.34  | 350  | 0.6909          | -0.9371        | -1.1226          | 0.5626             | 0.1855          | -25.2994       | -23.9158     | 14.0003         | 14.0037       |
+| 0.7276        | 0.39  | 400  | 0.6918          | -1.8471        | -2.0415          | 0.5868             | 0.1944          | -28.3625       | -26.9492     | 13.3382         | 13.3414       |
+| 0.6255        | 0.44  | 450  | 0.6860          | -1.5470        | -1.7599          | 0.5934             | 0.2129          | -27.4236       | -25.9489     | 13.2551         | 13.2584       |
+| 0.7342        | 0.49  | 500  | 0.6801          | -1.5841        | -1.7888          | 0.5758             | 0.2046          | -27.5199       | -26.0726     | 13.4186         | 13.4219       |
+| 0.568         | 0.54  | 550  | 0.6694          | -1.5101        | -1.7458          | 0.6022             | 0.2356          | -27.3766       | -25.8260     | 13.5776         | 13.5810       |
+| 0.6217        | 0.59  | 600  | 0.6645          | -1.4050        | -1.6543          | 0.6110             | 0.2492          | -27.0716       | -25.4756     | 13.6337         | 13.6371       |
+| 0.6186        | 0.64  | 650  | 0.6682          | -1.3826        | -1.6291          | 0.5978             | 0.2465          | -26.9876       | -25.4007     | 13.4204         | 13.4237       |
+| 0.6637        | 0.68  | 700  | 0.6633          | -1.3994        | -1.6501          | 0.6220             | 0.2507          | -27.0576       | -25.4569     | 13.4574         | 13.4608       |
+| 0.7482        | 0.73  | 750  | 0.6632          | -1.3772        | -1.6269          | 0.6198             | 0.2497          | -26.9804       | -25.3829     | 13.4047         | 13.4081       |
+| 0.6597        | 0.78  | 800  | 0.6627          | -1.3970        | -1.6527          | 0.6198             | 0.2557          | -27.0664       | -25.4489     | 13.3914         | 13.3948       |
+| 0.7206        | 0.83  | 850  | 0.6613          | -1.4018        | -1.6593          | 0.6220             | 0.2575          | -27.0885       | -25.4648     | 13.3862         | 13.3896       |
+| 0.6715        | 0.88  | 900  | 0.6633          | -1.4047        | -1.6584          | 0.6220             | 0.2537          | -27.0856       | -25.4746     | 13.3969         | 13.4003       |
+| 0.6108        | 0.93  | 950  | 0.6633          | -1.4042        | -1.6585          | 0.6242             | 0.2543          | -27.0857       | -25.4727     | 13.3883         | 13.3917       |
+| 0.5964        | 0.98  | 1000 | 0.6641          | -1.4066        | -1.6576          | 0.6198             | 0.2510          | -27.0829       | -25.4808     | 13.3887         | 13.3921       |
 ### Framework versions

config.json CHANGED Viewed

@@ -1,26 +1,46 @@
 {
-  "_name_or_path": "mistralai/Mistral-7B-Instruct-v0.1",
   "architectures": [
-    "MistralForCausalLM"
   ],
-  "attention_dropout": 0.0,
-  "bos_token_id": 1,
-  "eos_token_id": 2,
-  "hidden_act": "silu",
-  "hidden_size": 4096,
   "initializer_range": 0.02,
-  "intermediate_size": 14336,
-  "max_position_embeddings": 32768,
-  "model_type": "mistral",
-  "num_attention_heads": 32,
-  "num_hidden_layers": 32,
-  "num_key_value_heads": 8,
-  "rms_norm_eps": 1e-05,
-  "rope_theta": 10000.0,
-  "sliding_window": 4096,
-  "tie_word_embeddings": false,
   "torch_dtype": "float16",
   "transformers_version": "4.39.1",
   "use_cache": false,
-  "vocab_size": 32000
 }

 {
+  "_name_or_path": "mosaicml/mpt-7b-instruct",
   "architectures": [
+    "MptForCausalLM"
   ],
+  "attn_config": {
+    "model_type": ""
+  },
+  "auto_map": {
+    "AutoConfig": "mosaicml/mpt-7b-instruct--configuration_mpt.MPTConfig",
+    "AutoModelForCausalLM": "mosaicml/mpt-7b-instruct--modeling_mpt.MPTForCausalLM"
+  },
+  "d_model": 4096,
+  "emb_pdrop": 0,
+  "embedding_fraction": 1.0,
+  "expansion_ratio": 4,
+  "init_config": {
+    "emb_init_std": null,
+    "emb_init_uniform_lim": null,
+    "fan_mode": "fan_in",
+    "init_div_is_residual": true,
+    "init_gain": 0,
+    "init_nonlinearity": "relu",
+    "init_std": 0.02,
+    "name": "kaiming_normal_",
+    "verbose": 0
+  },
+  "init_device": "cpu",
   "initializer_range": 0.02,
+  "layer_norm_epsilon": 1e-05,
+  "learned_pos_emb": true,
+  "logit_scale": null,
+  "max_seq_len": 2048,
+  "model_type": "mpt",
+  "n_heads": 32,
+  "n_layers": 32,
+  "no_bias": true,
+  "norm_type": "low_precision_layernorm",
+  "resid_pdrop": 0,
+  "tokenizer_name": "EleutherAI/gpt-neox-20b",
   "torch_dtype": "float16",
   "transformers_version": "4.39.1",
   "use_cache": false,
+  "verbose": 0,
+  "vocab_size": 50432
 }

final_checkpoint/config.json CHANGED Viewed

@@ -1,26 +1,46 @@
 {
-  "_name_or_path": "mistralai/Mistral-7B-Instruct-v0.1",
   "architectures": [
-    "MistralForCausalLM"
   ],
-  "attention_dropout": 0.0,
-  "bos_token_id": 1,
-  "eos_token_id": 2,
-  "hidden_act": "silu",
-  "hidden_size": 4096,
   "initializer_range": 0.02,
-  "intermediate_size": 14336,
-  "max_position_embeddings": 32768,
-  "model_type": "mistral",
-  "num_attention_heads": 32,
-  "num_hidden_layers": 32,
-  "num_key_value_heads": 8,
-  "rms_norm_eps": 1e-05,
-  "rope_theta": 10000.0,
-  "sliding_window": 4096,
-  "tie_word_embeddings": false,
   "torch_dtype": "float16",
   "transformers_version": "4.39.1",
   "use_cache": false,
-  "vocab_size": 32000
 }

 {
+  "_name_or_path": "mosaicml/mpt-7b-instruct",
   "architectures": [
+    "MptForCausalLM"
   ],
+  "attn_config": {
+    "model_type": ""
+  },
+  "auto_map": {
+    "AutoConfig": "mosaicml/mpt-7b-instruct--configuration_mpt.MPTConfig",
+    "AutoModelForCausalLM": "mosaicml/mpt-7b-instruct--modeling_mpt.MPTForCausalLM"
+  },
+  "d_model": 4096,
+  "emb_pdrop": 0,
+  "embedding_fraction": 1.0,
+  "expansion_ratio": 4,
+  "init_config": {
+    "emb_init_std": null,
+    "emb_init_uniform_lim": null,
+    "fan_mode": "fan_in",
+    "init_div_is_residual": true,
+    "init_gain": 0,
+    "init_nonlinearity": "relu",
+    "init_std": 0.02,
+    "name": "kaiming_normal_",
+    "verbose": 0
+  },
+  "init_device": "cpu",
   "initializer_range": 0.02,
+  "layer_norm_epsilon": 1e-05,
+  "learned_pos_emb": true,
+  "logit_scale": null,
+  "max_seq_len": 2048,
+  "model_type": "mpt",
+  "n_heads": 32,
+  "n_layers": 32,
+  "no_bias": true,
+  "norm_type": "low_precision_layernorm",
+  "resid_pdrop": 0,
+  "tokenizer_name": "EleutherAI/gpt-neox-20b",
   "torch_dtype": "float16",
   "transformers_version": "4.39.1",
   "use_cache": false,
+  "verbose": 0,
+  "vocab_size": 50432
 }

final_checkpoint/generation_config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "_from_model_config": true,
-  "bos_token_id": 1,
-  "eos_token_id": 2,
-  "transformers_version": "4.39.1"
 }

 {
   "_from_model_config": true,
+  "eos_token_id": 0,
+  "transformers_version": "4.39.1",
+  "use_cache": false
 }

final_checkpoint/model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:24c2fee5f0076d795e1d2e566234ccadc4c0d14c80165d25ce332a7e3ca020c9
-size 4943162240

 version https://git-lfs.github.com/spec/v1
+oid sha256:1aef2d0bb5b9f576cd1873ec9de034fac83e25af00d50919492ddf51431a2114
+size 4976746424

final_checkpoint/model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db1ad22f00f3fe464724da3116b00376748f9f9c2e53fc3bd1758472e5e73706
-size 4999819232

 version https://git-lfs.github.com/spec/v1
+oid sha256:0494df8dc581f6d568140d4a3d0961d84abfc239aa2b155e682064f04e5b9ab7
+size 2386755584

generation_config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "_from_model_config": true,
-  "bos_token_id": 1,
-  "eos_token_id": 2,
-  "transformers_version": "4.39.1"
 }

 {
   "_from_model_config": true,
+  "eos_token_id": 0,
+  "transformers_version": "4.39.1",
+  "use_cache": false
 }

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:24c2fee5f0076d795e1d2e566234ccadc4c0d14c80165d25ce332a7e3ca020c9
-size 4943162240

 version https://git-lfs.github.com/spec/v1
+oid sha256:1aef2d0bb5b9f576cd1873ec9de034fac83e25af00d50919492ddf51431a2114
+size 4976746424

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db1ad22f00f3fe464724da3116b00376748f9f9c2e53fc3bd1758472e5e73706
-size 4999819232

 version https://git-lfs.github.com/spec/v1
+oid sha256:14b36e78d8fb271835ecc916c45a4c949f6f210664b73a5a8118bdd8690949e0
+size 4966260992

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:917200ffa3d6b6845f1707495e775c884a6bc1be4fef156dc3d383adebce1e63
-size 4540516256

 version https://git-lfs.github.com/spec/v1
+oid sha256:b8dd232e235e5190c9b5d9bb3080d51e9c2304e42dde3b47aea255f0e44f0b0b
+size 3355588232

model.safetensors.index.json CHANGED Viewed

@@ -1,298 +1,201 @@
 {
   "metadata": {
-    "total_size": 14483464192
   },
   "weight_map": {
-    "lm_head.weight": "model-00003-of-00003.safetensors",
-    "model.embed_tokens.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.10.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.10.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.10.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.2.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.20.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.22.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.22.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.22.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.22.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.22.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.3.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.30.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.4.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.norm.weight": "model-00003-of-00003.safetensors"
   }
 }

 {
   "metadata": {
+    "total_size": 13298573312
   },
   "weight_map": {
+    "transformer.blocks.0.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.0.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.0.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.0.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.0.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.0.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.1.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.1.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.1.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.1.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.1.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.1.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.10.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.10.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.10.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.10.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.10.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.10.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.11.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.11.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.11.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.11.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.11.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.11.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.12.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.12.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.12.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.12.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.12.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.12.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.13.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.13.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.13.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.13.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.13.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.13.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.14.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.14.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.14.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.14.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.14.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.14.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.15.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.15.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.15.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.15.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.15.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.15.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.16.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.16.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.16.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.16.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.16.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.16.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.17.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.17.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.17.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.17.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.17.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.17.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.18.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.18.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.18.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.18.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.18.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.18.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.19.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.19.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.19.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.19.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.19.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.19.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.2.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.2.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.2.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.2.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.2.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.2.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.20.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.20.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.20.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.20.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.20.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.20.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.21.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.21.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.21.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.21.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.21.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.21.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.22.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.22.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.22.ffn.down_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.22.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.22.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.22.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.23.attn.Wqkv.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.23.attn.out_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.23.ffn.down_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.23.ffn.up_proj.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.23.norm_1.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.23.norm_2.weight": "model-00002-of-00003.safetensors",
+    "transformer.blocks.24.attn.Wqkv.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.24.attn.out_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.24.ffn.down_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.24.ffn.up_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.24.norm_1.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.24.norm_2.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.25.attn.Wqkv.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.25.attn.out_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.25.ffn.down_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.25.ffn.up_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.25.norm_1.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.25.norm_2.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.26.attn.Wqkv.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.26.attn.out_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.26.ffn.down_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.26.ffn.up_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.26.norm_1.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.26.norm_2.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.27.attn.Wqkv.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.27.attn.out_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.27.ffn.down_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.27.ffn.up_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.27.norm_1.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.27.norm_2.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.28.attn.Wqkv.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.28.attn.out_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.28.ffn.down_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.28.ffn.up_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.28.norm_1.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.28.norm_2.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.29.attn.Wqkv.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.29.attn.out_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.29.ffn.down_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.29.ffn.up_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.29.norm_1.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.29.norm_2.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.3.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.3.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.3.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.3.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.3.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.3.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.30.attn.Wqkv.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.30.attn.out_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.30.ffn.down_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.30.ffn.up_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.30.norm_1.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.30.norm_2.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.31.attn.Wqkv.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.31.attn.out_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.31.ffn.down_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.31.ffn.up_proj.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.31.norm_1.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.31.norm_2.weight": "model-00003-of-00003.safetensors",
+    "transformer.blocks.4.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.4.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.4.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.4.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.4.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.4.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.5.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.5.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.5.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.5.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.5.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.5.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.6.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.6.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.6.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.6.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.6.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.6.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.7.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.7.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.7.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.7.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.7.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.7.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.8.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.8.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.8.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.8.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.8.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.8.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.9.attn.Wqkv.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.9.attn.out_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.9.ffn.down_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.9.ffn.up_proj.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.9.norm_1.weight": "model-00001-of-00003.safetensors",
+    "transformer.blocks.9.norm_2.weight": "model-00001-of-00003.safetensors",
+    "transformer.norm_f.weight": "model-00003-of-00003.safetensors",
+    "transformer.wte.weight": "model-00001-of-00003.safetensors"
   }
 }

special_tokens_map.json CHANGED Viewed

@@ -1,21 +1,21 @@
 {
   "bos_token": {
-    "content": "<s>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "eos_token": {
-    "content": "</s>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,
     "single_word": false
   },
-  "pad_token": "</s>",
   "unk_token": {
-    "content": "<unk>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,

 {
   "bos_token": {
+    "content": "<|endoftext|>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "eos_token": {
+    "content": "<|endoftext|>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,
     "single_word": false
   },
+  "pad_token": "<|endoftext|>",
   "unk_token": {
+    "content": "<|endoftext|>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -1,9 +1,8 @@
 {
-  "add_bos_token": true,
-  "add_eos_token": false,
   "added_tokens_decoder": {
     "0": {
-      "content": "<unk>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -11,33 +10,203 @@
       "special": true
     },
     "1": {
-      "content": "<s>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "2": {
-      "content": "</s>",
       "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
-      "special": true
     }
   },
-  "additional_special_tokens": [],
-  "bos_token": "<s>",
-  "chat_template": "{{ bos_token }}{% for message in messages %}{% if (message['role'] == 'user') != (loop.index0 % 2 == 0) %}{{ raise_exception('Conversation roles must alternate user/assistant/user/assistant/...') }}{% endif %}{% if message['role'] == 'user' %}{{ '[INST] ' + message['content'] + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ message['content'] + eos_token + ' ' }}{% else %}{{ raise_exception('Only user and assistant roles are supported!') }}{% endif %}{% endfor %}",
-  "clean_up_tokenization_spaces": false,
-  "eos_token": "</s>",
-  "legacy": true,
-  "model_max_length": 1000000000000000019884624838656,
-  "pad_token": "</s>",
-  "sp_model_kwargs": {},
-  "spaces_between_special_tokens": false,
-  "tokenizer_class": "LlamaTokenizer",
-  "unk_token": "<unk>",
-  "use_default_system_prompt": false
 }

 {
+  "add_prefix_space": false,
   "added_tokens_decoder": {
     "0": {
+      "content": "<|endoftext|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": true
     },
     "1": {
+      "content": "<|padding|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "50254": {
+      "content": "                        ",
       "lstrip": false,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
+      "special": false
+    },
+    "50255": {
+      "content": "                       ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50256": {
+      "content": "                      ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50257": {
+      "content": "                     ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50258": {
+      "content": "                    ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50259": {
+      "content": "                   ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50260": {
+      "content": "                  ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50261": {
+      "content": "                 ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50262": {
+      "content": "                ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50263": {
+      "content": "               ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50264": {
+      "content": "              ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50265": {
+      "content": "             ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50266": {
+      "content": "            ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50267": {
+      "content": "           ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50268": {
+      "content": "          ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50269": {
+      "content": "         ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50270": {
+      "content": "        ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50271": {
+      "content": "       ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50272": {
+      "content": "      ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50273": {
+      "content": "     ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50274": {
+      "content": "    ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50275": {
+      "content": "   ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50276": {
+      "content": "  ",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
     }
   },
+  "bos_token": "<|endoftext|>",
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "<|endoftext|>",
+  "model_max_length": 2048,
+  "pad_token": "<|endoftext|>",
+  "tokenizer_class": "GPTNeoXTokenizer",
+  "unk_token": "<|endoftext|>"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab87f356e42dafed061e95415a2fec2d2467604663a2ab3281cc53ad51cedba1
 size 4475

 version https://git-lfs.github.com/spec/v1
+oid sha256:96a468d1102d1d9c46447bce3b5a0a66d05ed25a247c1bee457c1a3971d444fa
 size 4475