mlx-community
/

mxbai-embed-large-v1

@@ -17,10 +17,6 @@
     "num_hidden_layers": 24,
     "pad_token_id": 0,
     "position_embedding_type": "absolute",
-    "quantization": {
-        "group_size": 64,
-        "bits": 4
-    },
     "torch_dtype": "float16",
     "transformers_version": "4.38.2",
     "type_vocab_size": 2,

     "num_hidden_layers": 24,
     "pad_token_id": 0,
     "position_embedding_type": "absolute",
     "torch_dtype": "float16",
     "transformers_version": "4.38.2",
     "type_vocab_size": 2,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:136d41998211d77b0b5e998538c7892547672ecbdc8701e48f4427269b7d7c13
-size 189058926

 version https://git-lfs.github.com/spec/v1
+oid sha256:72e2bf99248ebe7b1fbeb7cab80b7ba10a4e5818f4030ad0d6ec121ab4925bd5
+size 670328346

model.safetensors.index.json CHANGED Viewed

@@ -1,694 +1,398 @@
 {
     "metadata": {
-        "total_size": 188980992
     },
     "weight_map": {
         "embeddings.LayerNorm.bias": "model.safetensors",
         "embeddings.LayerNorm.weight": "model.safetensors",
-        "embeddings.position_embeddings.biases": "model.safetensors",
-        "embeddings.position_embeddings.scales": "model.safetensors",
         "embeddings.position_embeddings.weight": "model.safetensors",
-        "embeddings.token_type_embeddings.biases": "model.safetensors",
-        "embeddings.token_type_embeddings.scales": "model.safetensors",
         "embeddings.token_type_embeddings.weight": "model.safetensors",
-        "embeddings.word_embeddings.biases": "model.safetensors",
-        "embeddings.word_embeddings.scales": "model.safetensors",
         "embeddings.word_embeddings.weight": "model.safetensors",
         "encoder.layer.0.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.0.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.0.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.0.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.0.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.0.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.0.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.0.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.0.attention.self.key.scales": "model.safetensors",
         "encoder.layer.0.attention.self.key.weight": "model.safetensors",
         "encoder.layer.0.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.0.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.0.attention.self.query.scales": "model.safetensors",
         "encoder.layer.0.attention.self.query.weight": "model.safetensors",
         "encoder.layer.0.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.0.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.0.attention.self.value.scales": "model.safetensors",
         "encoder.layer.0.attention.self.value.weight": "model.safetensors",
         "encoder.layer.0.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.0.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.0.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.0.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.0.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.0.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.0.output.dense.bias": "model.safetensors",
-        "encoder.layer.0.output.dense.biases": "model.safetensors",
-        "encoder.layer.0.output.dense.scales": "model.safetensors",
         "encoder.layer.0.output.dense.weight": "model.safetensors",
         "encoder.layer.1.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.1.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.1.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.1.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.1.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.1.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.1.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.1.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.1.attention.self.key.scales": "model.safetensors",
         "encoder.layer.1.attention.self.key.weight": "model.safetensors",
         "encoder.layer.1.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.1.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.1.attention.self.query.scales": "model.safetensors",
         "encoder.layer.1.attention.self.query.weight": "model.safetensors",
         "encoder.layer.1.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.1.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.1.attention.self.value.scales": "model.safetensors",
         "encoder.layer.1.attention.self.value.weight": "model.safetensors",
         "encoder.layer.1.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.1.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.1.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.1.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.1.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.1.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.1.output.dense.bias": "model.safetensors",
-        "encoder.layer.1.output.dense.biases": "model.safetensors",
-        "encoder.layer.1.output.dense.scales": "model.safetensors",
         "encoder.layer.1.output.dense.weight": "model.safetensors",
         "encoder.layer.10.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.10.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.10.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.10.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.10.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.10.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.10.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.10.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.10.attention.self.key.scales": "model.safetensors",
         "encoder.layer.10.attention.self.key.weight": "model.safetensors",
         "encoder.layer.10.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.10.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.10.attention.self.query.scales": "model.safetensors",
         "encoder.layer.10.attention.self.query.weight": "model.safetensors",
         "encoder.layer.10.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.10.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.10.attention.self.value.scales": "model.safetensors",
         "encoder.layer.10.attention.self.value.weight": "model.safetensors",
         "encoder.layer.10.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.10.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.10.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.10.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.10.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.10.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.10.output.dense.bias": "model.safetensors",
-        "encoder.layer.10.output.dense.biases": "model.safetensors",
-        "encoder.layer.10.output.dense.scales": "model.safetensors",
         "encoder.layer.10.output.dense.weight": "model.safetensors",
         "encoder.layer.11.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.11.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.11.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.11.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.11.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.11.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.11.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.11.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.11.attention.self.key.scales": "model.safetensors",
         "encoder.layer.11.attention.self.key.weight": "model.safetensors",
         "encoder.layer.11.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.11.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.11.attention.self.query.scales": "model.safetensors",
         "encoder.layer.11.attention.self.query.weight": "model.safetensors",
         "encoder.layer.11.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.11.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.11.attention.self.value.scales": "model.safetensors",
         "encoder.layer.11.attention.self.value.weight": "model.safetensors",
         "encoder.layer.11.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.11.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.11.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.11.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.11.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.11.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.11.output.dense.bias": "model.safetensors",
-        "encoder.layer.11.output.dense.biases": "model.safetensors",
-        "encoder.layer.11.output.dense.scales": "model.safetensors",
         "encoder.layer.11.output.dense.weight": "model.safetensors",
         "encoder.layer.12.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.12.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.12.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.12.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.12.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.12.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.12.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.12.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.12.attention.self.key.scales": "model.safetensors",
         "encoder.layer.12.attention.self.key.weight": "model.safetensors",
         "encoder.layer.12.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.12.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.12.attention.self.query.scales": "model.safetensors",
         "encoder.layer.12.attention.self.query.weight": "model.safetensors",
         "encoder.layer.12.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.12.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.12.attention.self.value.scales": "model.safetensors",
         "encoder.layer.12.attention.self.value.weight": "model.safetensors",
         "encoder.layer.12.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.12.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.12.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.12.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.12.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.12.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.12.output.dense.bias": "model.safetensors",
-        "encoder.layer.12.output.dense.biases": "model.safetensors",
-        "encoder.layer.12.output.dense.scales": "model.safetensors",
         "encoder.layer.12.output.dense.weight": "model.safetensors",
         "encoder.layer.13.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.13.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.13.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.13.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.13.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.13.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.13.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.13.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.13.attention.self.key.scales": "model.safetensors",
         "encoder.layer.13.attention.self.key.weight": "model.safetensors",
         "encoder.layer.13.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.13.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.13.attention.self.query.scales": "model.safetensors",
         "encoder.layer.13.attention.self.query.weight": "model.safetensors",
         "encoder.layer.13.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.13.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.13.attention.self.value.scales": "model.safetensors",
         "encoder.layer.13.attention.self.value.weight": "model.safetensors",
         "encoder.layer.13.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.13.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.13.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.13.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.13.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.13.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.13.output.dense.bias": "model.safetensors",
-        "encoder.layer.13.output.dense.biases": "model.safetensors",
-        "encoder.layer.13.output.dense.scales": "model.safetensors",
         "encoder.layer.13.output.dense.weight": "model.safetensors",
         "encoder.layer.14.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.14.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.14.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.14.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.14.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.14.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.14.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.14.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.14.attention.self.key.scales": "model.safetensors",
         "encoder.layer.14.attention.self.key.weight": "model.safetensors",
         "encoder.layer.14.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.14.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.14.attention.self.query.scales": "model.safetensors",
         "encoder.layer.14.attention.self.query.weight": "model.safetensors",
         "encoder.layer.14.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.14.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.14.attention.self.value.scales": "model.safetensors",
         "encoder.layer.14.attention.self.value.weight": "model.safetensors",
         "encoder.layer.14.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.14.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.14.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.14.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.14.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.14.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.14.output.dense.bias": "model.safetensors",
-        "encoder.layer.14.output.dense.biases": "model.safetensors",
-        "encoder.layer.14.output.dense.scales": "model.safetensors",
         "encoder.layer.14.output.dense.weight": "model.safetensors",
         "encoder.layer.15.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.15.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.15.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.15.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.15.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.15.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.15.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.15.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.15.attention.self.key.scales": "model.safetensors",
         "encoder.layer.15.attention.self.key.weight": "model.safetensors",
         "encoder.layer.15.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.15.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.15.attention.self.query.scales": "model.safetensors",
         "encoder.layer.15.attention.self.query.weight": "model.safetensors",
         "encoder.layer.15.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.15.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.15.attention.self.value.scales": "model.safetensors",
         "encoder.layer.15.attention.self.value.weight": "model.safetensors",
         "encoder.layer.15.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.15.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.15.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.15.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.15.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.15.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.15.output.dense.bias": "model.safetensors",
-        "encoder.layer.15.output.dense.biases": "model.safetensors",
-        "encoder.layer.15.output.dense.scales": "model.safetensors",
         "encoder.layer.15.output.dense.weight": "model.safetensors",
         "encoder.layer.16.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.16.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.16.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.16.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.16.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.16.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.16.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.16.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.16.attention.self.key.scales": "model.safetensors",
         "encoder.layer.16.attention.self.key.weight": "model.safetensors",
         "encoder.layer.16.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.16.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.16.attention.self.query.scales": "model.safetensors",
         "encoder.layer.16.attention.self.query.weight": "model.safetensors",
         "encoder.layer.16.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.16.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.16.attention.self.value.scales": "model.safetensors",
         "encoder.layer.16.attention.self.value.weight": "model.safetensors",
         "encoder.layer.16.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.16.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.16.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.16.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.16.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.16.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.16.output.dense.bias": "model.safetensors",
-        "encoder.layer.16.output.dense.biases": "model.safetensors",
-        "encoder.layer.16.output.dense.scales": "model.safetensors",
         "encoder.layer.16.output.dense.weight": "model.safetensors",
         "encoder.layer.17.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.17.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.17.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.17.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.17.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.17.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.17.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.17.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.17.attention.self.key.scales": "model.safetensors",
         "encoder.layer.17.attention.self.key.weight": "model.safetensors",
         "encoder.layer.17.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.17.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.17.attention.self.query.scales": "model.safetensors",
         "encoder.layer.17.attention.self.query.weight": "model.safetensors",
         "encoder.layer.17.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.17.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.17.attention.self.value.scales": "model.safetensors",
         "encoder.layer.17.attention.self.value.weight": "model.safetensors",
         "encoder.layer.17.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.17.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.17.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.17.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.17.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.17.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.17.output.dense.bias": "model.safetensors",
-        "encoder.layer.17.output.dense.biases": "model.safetensors",
-        "encoder.layer.17.output.dense.scales": "model.safetensors",
         "encoder.layer.17.output.dense.weight": "model.safetensors",
         "encoder.layer.18.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.18.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.18.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.18.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.18.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.18.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.18.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.18.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.18.attention.self.key.scales": "model.safetensors",
         "encoder.layer.18.attention.self.key.weight": "model.safetensors",
         "encoder.layer.18.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.18.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.18.attention.self.query.scales": "model.safetensors",
         "encoder.layer.18.attention.self.query.weight": "model.safetensors",
         "encoder.layer.18.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.18.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.18.attention.self.value.scales": "model.safetensors",
         "encoder.layer.18.attention.self.value.weight": "model.safetensors",
         "encoder.layer.18.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.18.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.18.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.18.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.18.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.18.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.18.output.dense.bias": "model.safetensors",
-        "encoder.layer.18.output.dense.biases": "model.safetensors",
-        "encoder.layer.18.output.dense.scales": "model.safetensors",
         "encoder.layer.18.output.dense.weight": "model.safetensors",
         "encoder.layer.19.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.19.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.19.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.19.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.19.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.19.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.19.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.19.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.19.attention.self.key.scales": "model.safetensors",
         "encoder.layer.19.attention.self.key.weight": "model.safetensors",
         "encoder.layer.19.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.19.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.19.attention.self.query.scales": "model.safetensors",
         "encoder.layer.19.attention.self.query.weight": "model.safetensors",
         "encoder.layer.19.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.19.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.19.attention.self.value.scales": "model.safetensors",
         "encoder.layer.19.attention.self.value.weight": "model.safetensors",
         "encoder.layer.19.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.19.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.19.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.19.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.19.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.19.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.19.output.dense.bias": "model.safetensors",
-        "encoder.layer.19.output.dense.biases": "model.safetensors",
-        "encoder.layer.19.output.dense.scales": "model.safetensors",
         "encoder.layer.19.output.dense.weight": "model.safetensors",
         "encoder.layer.2.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.2.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.2.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.2.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.2.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.2.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.2.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.2.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.2.attention.self.key.scales": "model.safetensors",
         "encoder.layer.2.attention.self.key.weight": "model.safetensors",
         "encoder.layer.2.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.2.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.2.attention.self.query.scales": "model.safetensors",
         "encoder.layer.2.attention.self.query.weight": "model.safetensors",
         "encoder.layer.2.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.2.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.2.attention.self.value.scales": "model.safetensors",
         "encoder.layer.2.attention.self.value.weight": "model.safetensors",
         "encoder.layer.2.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.2.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.2.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.2.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.2.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.2.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.2.output.dense.bias": "model.safetensors",
-        "encoder.layer.2.output.dense.biases": "model.safetensors",
-        "encoder.layer.2.output.dense.scales": "model.safetensors",
         "encoder.layer.2.output.dense.weight": "model.safetensors",
         "encoder.layer.20.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.20.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.20.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.20.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.20.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.20.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.20.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.20.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.20.attention.self.key.scales": "model.safetensors",
         "encoder.layer.20.attention.self.key.weight": "model.safetensors",
         "encoder.layer.20.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.20.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.20.attention.self.query.scales": "model.safetensors",
         "encoder.layer.20.attention.self.query.weight": "model.safetensors",
         "encoder.layer.20.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.20.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.20.attention.self.value.scales": "model.safetensors",
         "encoder.layer.20.attention.self.value.weight": "model.safetensors",
         "encoder.layer.20.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.20.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.20.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.20.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.20.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.20.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.20.output.dense.bias": "model.safetensors",
-        "encoder.layer.20.output.dense.biases": "model.safetensors",
-        "encoder.layer.20.output.dense.scales": "model.safetensors",
         "encoder.layer.20.output.dense.weight": "model.safetensors",
         "encoder.layer.21.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.21.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.21.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.21.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.21.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.21.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.21.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.21.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.21.attention.self.key.scales": "model.safetensors",
         "encoder.layer.21.attention.self.key.weight": "model.safetensors",
         "encoder.layer.21.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.21.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.21.attention.self.query.scales": "model.safetensors",
         "encoder.layer.21.attention.self.query.weight": "model.safetensors",
         "encoder.layer.21.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.21.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.21.attention.self.value.scales": "model.safetensors",
         "encoder.layer.21.attention.self.value.weight": "model.safetensors",
         "encoder.layer.21.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.21.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.21.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.21.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.21.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.21.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.21.output.dense.bias": "model.safetensors",
-        "encoder.layer.21.output.dense.biases": "model.safetensors",
-        "encoder.layer.21.output.dense.scales": "model.safetensors",
         "encoder.layer.21.output.dense.weight": "model.safetensors",
         "encoder.layer.22.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.22.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.22.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.22.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.22.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.22.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.22.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.22.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.22.attention.self.key.scales": "model.safetensors",
         "encoder.layer.22.attention.self.key.weight": "model.safetensors",
         "encoder.layer.22.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.22.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.22.attention.self.query.scales": "model.safetensors",
         "encoder.layer.22.attention.self.query.weight": "model.safetensors",
         "encoder.layer.22.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.22.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.22.attention.self.value.scales": "model.safetensors",
         "encoder.layer.22.attention.self.value.weight": "model.safetensors",
         "encoder.layer.22.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.22.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.22.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.22.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.22.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.22.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.22.output.dense.bias": "model.safetensors",
-        "encoder.layer.22.output.dense.biases": "model.safetensors",
-        "encoder.layer.22.output.dense.scales": "model.safetensors",
         "encoder.layer.22.output.dense.weight": "model.safetensors",
         "encoder.layer.23.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.23.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.23.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.23.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.23.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.23.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.23.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.23.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.23.attention.self.key.scales": "model.safetensors",
         "encoder.layer.23.attention.self.key.weight": "model.safetensors",
         "encoder.layer.23.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.23.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.23.attention.self.query.scales": "model.safetensors",
         "encoder.layer.23.attention.self.query.weight": "model.safetensors",
         "encoder.layer.23.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.23.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.23.attention.self.value.scales": "model.safetensors",
         "encoder.layer.23.attention.self.value.weight": "model.safetensors",
         "encoder.layer.23.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.23.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.23.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.23.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.23.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.23.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.23.output.dense.bias": "model.safetensors",
-        "encoder.layer.23.output.dense.biases": "model.safetensors",
-        "encoder.layer.23.output.dense.scales": "model.safetensors",
         "encoder.layer.23.output.dense.weight": "model.safetensors",
         "encoder.layer.3.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.3.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.3.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.3.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.3.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.3.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.3.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.3.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.3.attention.self.key.scales": "model.safetensors",
         "encoder.layer.3.attention.self.key.weight": "model.safetensors",
         "encoder.layer.3.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.3.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.3.attention.self.query.scales": "model.safetensors",
         "encoder.layer.3.attention.self.query.weight": "model.safetensors",
         "encoder.layer.3.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.3.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.3.attention.self.value.scales": "model.safetensors",
         "encoder.layer.3.attention.self.value.weight": "model.safetensors",
         "encoder.layer.3.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.3.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.3.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.3.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.3.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.3.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.3.output.dense.bias": "model.safetensors",
-        "encoder.layer.3.output.dense.biases": "model.safetensors",
-        "encoder.layer.3.output.dense.scales": "model.safetensors",
         "encoder.layer.3.output.dense.weight": "model.safetensors",
         "encoder.layer.4.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.4.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.4.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.4.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.4.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.4.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.4.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.4.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.4.attention.self.key.scales": "model.safetensors",
         "encoder.layer.4.attention.self.key.weight": "model.safetensors",
         "encoder.layer.4.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.4.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.4.attention.self.query.scales": "model.safetensors",
         "encoder.layer.4.attention.self.query.weight": "model.safetensors",
         "encoder.layer.4.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.4.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.4.attention.self.value.scales": "model.safetensors",
         "encoder.layer.4.attention.self.value.weight": "model.safetensors",
         "encoder.layer.4.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.4.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.4.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.4.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.4.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.4.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.4.output.dense.bias": "model.safetensors",
-        "encoder.layer.4.output.dense.biases": "model.safetensors",
-        "encoder.layer.4.output.dense.scales": "model.safetensors",
         "encoder.layer.4.output.dense.weight": "model.safetensors",
         "encoder.layer.5.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.5.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.5.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.5.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.5.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.5.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.5.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.5.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.5.attention.self.key.scales": "model.safetensors",
         "encoder.layer.5.attention.self.key.weight": "model.safetensors",
         "encoder.layer.5.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.5.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.5.attention.self.query.scales": "model.safetensors",
         "encoder.layer.5.attention.self.query.weight": "model.safetensors",
         "encoder.layer.5.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.5.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.5.attention.self.value.scales": "model.safetensors",
         "encoder.layer.5.attention.self.value.weight": "model.safetensors",
         "encoder.layer.5.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.5.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.5.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.5.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.5.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.5.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.5.output.dense.bias": "model.safetensors",
-        "encoder.layer.5.output.dense.biases": "model.safetensors",
-        "encoder.layer.5.output.dense.scales": "model.safetensors",
         "encoder.layer.5.output.dense.weight": "model.safetensors",
         "encoder.layer.6.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.6.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.6.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.6.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.6.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.6.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.6.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.6.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.6.attention.self.key.scales": "model.safetensors",
         "encoder.layer.6.attention.self.key.weight": "model.safetensors",
         "encoder.layer.6.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.6.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.6.attention.self.query.scales": "model.safetensors",
         "encoder.layer.6.attention.self.query.weight": "model.safetensors",
         "encoder.layer.6.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.6.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.6.attention.self.value.scales": "model.safetensors",
         "encoder.layer.6.attention.self.value.weight": "model.safetensors",
         "encoder.layer.6.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.6.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.6.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.6.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.6.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.6.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.6.output.dense.bias": "model.safetensors",
-        "encoder.layer.6.output.dense.biases": "model.safetensors",
-        "encoder.layer.6.output.dense.scales": "model.safetensors",
         "encoder.layer.6.output.dense.weight": "model.safetensors",
         "encoder.layer.7.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.7.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.7.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.7.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.7.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.7.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.7.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.7.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.7.attention.self.key.scales": "model.safetensors",
         "encoder.layer.7.attention.self.key.weight": "model.safetensors",
         "encoder.layer.7.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.7.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.7.attention.self.query.scales": "model.safetensors",
         "encoder.layer.7.attention.self.query.weight": "model.safetensors",
         "encoder.layer.7.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.7.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.7.attention.self.value.scales": "model.safetensors",
         "encoder.layer.7.attention.self.value.weight": "model.safetensors",
         "encoder.layer.7.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.7.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.7.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.7.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.7.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.7.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.7.output.dense.bias": "model.safetensors",
-        "encoder.layer.7.output.dense.biases": "model.safetensors",
-        "encoder.layer.7.output.dense.scales": "model.safetensors",
         "encoder.layer.7.output.dense.weight": "model.safetensors",
         "encoder.layer.8.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.8.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.8.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.8.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.8.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.8.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.8.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.8.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.8.attention.self.key.scales": "model.safetensors",
         "encoder.layer.8.attention.self.key.weight": "model.safetensors",
         "encoder.layer.8.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.8.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.8.attention.self.query.scales": "model.safetensors",
         "encoder.layer.8.attention.self.query.weight": "model.safetensors",
         "encoder.layer.8.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.8.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.8.attention.self.value.scales": "model.safetensors",
         "encoder.layer.8.attention.self.value.weight": "model.safetensors",
         "encoder.layer.8.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.8.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.8.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.8.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.8.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.8.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.8.output.dense.bias": "model.safetensors",
-        "encoder.layer.8.output.dense.biases": "model.safetensors",
-        "encoder.layer.8.output.dense.scales": "model.safetensors",
         "encoder.layer.8.output.dense.weight": "model.safetensors",
         "encoder.layer.9.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.9.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.9.attention.output.dense.bias": "model.safetensors",
-        "encoder.layer.9.attention.output.dense.biases": "model.safetensors",
-        "encoder.layer.9.attention.output.dense.scales": "model.safetensors",
         "encoder.layer.9.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.9.attention.self.key.bias": "model.safetensors",
-        "encoder.layer.9.attention.self.key.biases": "model.safetensors",
-        "encoder.layer.9.attention.self.key.scales": "model.safetensors",
         "encoder.layer.9.attention.self.key.weight": "model.safetensors",
         "encoder.layer.9.attention.self.query.bias": "model.safetensors",
-        "encoder.layer.9.attention.self.query.biases": "model.safetensors",
-        "encoder.layer.9.attention.self.query.scales": "model.safetensors",
         "encoder.layer.9.attention.self.query.weight": "model.safetensors",
         "encoder.layer.9.attention.self.value.bias": "model.safetensors",
-        "encoder.layer.9.attention.self.value.biases": "model.safetensors",
-        "encoder.layer.9.attention.self.value.scales": "model.safetensors",
         "encoder.layer.9.attention.self.value.weight": "model.safetensors",
         "encoder.layer.9.intermediate.dense.bias": "model.safetensors",
-        "encoder.layer.9.intermediate.dense.biases": "model.safetensors",
-        "encoder.layer.9.intermediate.dense.scales": "model.safetensors",
         "encoder.layer.9.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.9.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.9.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.9.output.dense.bias": "model.safetensors",
-        "encoder.layer.9.output.dense.biases": "model.safetensors",
-        "encoder.layer.9.output.dense.scales": "model.safetensors",
         "encoder.layer.9.output.dense.weight": "model.safetensors",
         "pooler.dense.bias": "model.safetensors",
-        "pooler.dense.biases": "model.safetensors",
-        "pooler.dense.scales": "model.safetensors",
         "pooler.dense.weight": "model.safetensors"
     }
 }

 {
     "metadata": {
+        "total_size": 670283776
     },
     "weight_map": {
         "embeddings.LayerNorm.bias": "model.safetensors",
         "embeddings.LayerNorm.weight": "model.safetensors",
         "embeddings.position_embeddings.weight": "model.safetensors",
         "embeddings.token_type_embeddings.weight": "model.safetensors",
         "embeddings.word_embeddings.weight": "model.safetensors",
         "encoder.layer.0.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.0.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.0.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.0.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.0.attention.self.key.bias": "model.safetensors",
         "encoder.layer.0.attention.self.key.weight": "model.safetensors",
         "encoder.layer.0.attention.self.query.bias": "model.safetensors",
         "encoder.layer.0.attention.self.query.weight": "model.safetensors",
         "encoder.layer.0.attention.self.value.bias": "model.safetensors",
         "encoder.layer.0.attention.self.value.weight": "model.safetensors",
         "encoder.layer.0.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.0.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.0.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.0.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.0.output.dense.bias": "model.safetensors",
         "encoder.layer.0.output.dense.weight": "model.safetensors",
         "encoder.layer.1.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.1.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.1.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.1.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.1.attention.self.key.bias": "model.safetensors",
         "encoder.layer.1.attention.self.key.weight": "model.safetensors",
         "encoder.layer.1.attention.self.query.bias": "model.safetensors",
         "encoder.layer.1.attention.self.query.weight": "model.safetensors",
         "encoder.layer.1.attention.self.value.bias": "model.safetensors",
         "encoder.layer.1.attention.self.value.weight": "model.safetensors",
         "encoder.layer.1.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.1.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.1.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.1.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.1.output.dense.bias": "model.safetensors",
         "encoder.layer.1.output.dense.weight": "model.safetensors",
         "encoder.layer.10.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.10.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.10.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.10.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.10.attention.self.key.bias": "model.safetensors",
         "encoder.layer.10.attention.self.key.weight": "model.safetensors",
         "encoder.layer.10.attention.self.query.bias": "model.safetensors",
         "encoder.layer.10.attention.self.query.weight": "model.safetensors",
         "encoder.layer.10.attention.self.value.bias": "model.safetensors",
         "encoder.layer.10.attention.self.value.weight": "model.safetensors",
         "encoder.layer.10.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.10.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.10.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.10.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.10.output.dense.bias": "model.safetensors",
         "encoder.layer.10.output.dense.weight": "model.safetensors",
         "encoder.layer.11.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.11.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.11.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.11.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.11.attention.self.key.bias": "model.safetensors",
         "encoder.layer.11.attention.self.key.weight": "model.safetensors",
         "encoder.layer.11.attention.self.query.bias": "model.safetensors",
         "encoder.layer.11.attention.self.query.weight": "model.safetensors",
         "encoder.layer.11.attention.self.value.bias": "model.safetensors",
         "encoder.layer.11.attention.self.value.weight": "model.safetensors",
         "encoder.layer.11.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.11.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.11.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.11.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.11.output.dense.bias": "model.safetensors",
         "encoder.layer.11.output.dense.weight": "model.safetensors",
         "encoder.layer.12.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.12.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.12.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.12.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.12.attention.self.key.bias": "model.safetensors",
         "encoder.layer.12.attention.self.key.weight": "model.safetensors",
         "encoder.layer.12.attention.self.query.bias": "model.safetensors",
         "encoder.layer.12.attention.self.query.weight": "model.safetensors",
         "encoder.layer.12.attention.self.value.bias": "model.safetensors",
         "encoder.layer.12.attention.self.value.weight": "model.safetensors",
         "encoder.layer.12.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.12.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.12.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.12.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.12.output.dense.bias": "model.safetensors",
         "encoder.layer.12.output.dense.weight": "model.safetensors",
         "encoder.layer.13.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.13.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.13.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.13.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.13.attention.self.key.bias": "model.safetensors",
         "encoder.layer.13.attention.self.key.weight": "model.safetensors",
         "encoder.layer.13.attention.self.query.bias": "model.safetensors",
         "encoder.layer.13.attention.self.query.weight": "model.safetensors",
         "encoder.layer.13.attention.self.value.bias": "model.safetensors",
         "encoder.layer.13.attention.self.value.weight": "model.safetensors",
         "encoder.layer.13.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.13.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.13.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.13.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.13.output.dense.bias": "model.safetensors",
         "encoder.layer.13.output.dense.weight": "model.safetensors",
         "encoder.layer.14.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.14.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.14.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.14.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.14.attention.self.key.bias": "model.safetensors",
         "encoder.layer.14.attention.self.key.weight": "model.safetensors",
         "encoder.layer.14.attention.self.query.bias": "model.safetensors",
         "encoder.layer.14.attention.self.query.weight": "model.safetensors",
         "encoder.layer.14.attention.self.value.bias": "model.safetensors",
         "encoder.layer.14.attention.self.value.weight": "model.safetensors",
         "encoder.layer.14.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.14.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.14.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.14.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.14.output.dense.bias": "model.safetensors",
         "encoder.layer.14.output.dense.weight": "model.safetensors",
         "encoder.layer.15.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.15.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.15.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.15.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.15.attention.self.key.bias": "model.safetensors",
         "encoder.layer.15.attention.self.key.weight": "model.safetensors",
         "encoder.layer.15.attention.self.query.bias": "model.safetensors",
         "encoder.layer.15.attention.self.query.weight": "model.safetensors",
         "encoder.layer.15.attention.self.value.bias": "model.safetensors",
         "encoder.layer.15.attention.self.value.weight": "model.safetensors",
         "encoder.layer.15.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.15.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.15.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.15.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.15.output.dense.bias": "model.safetensors",
         "encoder.layer.15.output.dense.weight": "model.safetensors",
         "encoder.layer.16.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.16.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.16.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.16.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.16.attention.self.key.bias": "model.safetensors",
         "encoder.layer.16.attention.self.key.weight": "model.safetensors",
         "encoder.layer.16.attention.self.query.bias": "model.safetensors",
         "encoder.layer.16.attention.self.query.weight": "model.safetensors",
         "encoder.layer.16.attention.self.value.bias": "model.safetensors",
         "encoder.layer.16.attention.self.value.weight": "model.safetensors",
         "encoder.layer.16.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.16.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.16.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.16.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.16.output.dense.bias": "model.safetensors",
         "encoder.layer.16.output.dense.weight": "model.safetensors",
         "encoder.layer.17.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.17.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.17.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.17.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.17.attention.self.key.bias": "model.safetensors",
         "encoder.layer.17.attention.self.key.weight": "model.safetensors",
         "encoder.layer.17.attention.self.query.bias": "model.safetensors",
         "encoder.layer.17.attention.self.query.weight": "model.safetensors",
         "encoder.layer.17.attention.self.value.bias": "model.safetensors",
         "encoder.layer.17.attention.self.value.weight": "model.safetensors",
         "encoder.layer.17.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.17.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.17.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.17.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.17.output.dense.bias": "model.safetensors",
         "encoder.layer.17.output.dense.weight": "model.safetensors",
         "encoder.layer.18.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.18.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.18.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.18.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.18.attention.self.key.bias": "model.safetensors",
         "encoder.layer.18.attention.self.key.weight": "model.safetensors",
         "encoder.layer.18.attention.self.query.bias": "model.safetensors",
         "encoder.layer.18.attention.self.query.weight": "model.safetensors",
         "encoder.layer.18.attention.self.value.bias": "model.safetensors",
         "encoder.layer.18.attention.self.value.weight": "model.safetensors",
         "encoder.layer.18.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.18.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.18.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.18.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.18.output.dense.bias": "model.safetensors",
         "encoder.layer.18.output.dense.weight": "model.safetensors",
         "encoder.layer.19.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.19.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.19.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.19.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.19.attention.self.key.bias": "model.safetensors",
         "encoder.layer.19.attention.self.key.weight": "model.safetensors",
         "encoder.layer.19.attention.self.query.bias": "model.safetensors",
         "encoder.layer.19.attention.self.query.weight": "model.safetensors",
         "encoder.layer.19.attention.self.value.bias": "model.safetensors",
         "encoder.layer.19.attention.self.value.weight": "model.safetensors",
         "encoder.layer.19.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.19.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.19.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.19.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.19.output.dense.bias": "model.safetensors",
         "encoder.layer.19.output.dense.weight": "model.safetensors",
         "encoder.layer.2.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.2.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.2.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.2.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.2.attention.self.key.bias": "model.safetensors",
         "encoder.layer.2.attention.self.key.weight": "model.safetensors",
         "encoder.layer.2.attention.self.query.bias": "model.safetensors",
         "encoder.layer.2.attention.self.query.weight": "model.safetensors",
         "encoder.layer.2.attention.self.value.bias": "model.safetensors",
         "encoder.layer.2.attention.self.value.weight": "model.safetensors",
         "encoder.layer.2.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.2.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.2.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.2.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.2.output.dense.bias": "model.safetensors",
         "encoder.layer.2.output.dense.weight": "model.safetensors",
         "encoder.layer.20.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.20.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.20.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.20.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.20.attention.self.key.bias": "model.safetensors",
         "encoder.layer.20.attention.self.key.weight": "model.safetensors",
         "encoder.layer.20.attention.self.query.bias": "model.safetensors",
         "encoder.layer.20.attention.self.query.weight": "model.safetensors",
         "encoder.layer.20.attention.self.value.bias": "model.safetensors",
         "encoder.layer.20.attention.self.value.weight": "model.safetensors",
         "encoder.layer.20.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.20.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.20.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.20.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.20.output.dense.bias": "model.safetensors",
         "encoder.layer.20.output.dense.weight": "model.safetensors",
         "encoder.layer.21.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.21.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.21.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.21.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.21.attention.self.key.bias": "model.safetensors",
         "encoder.layer.21.attention.self.key.weight": "model.safetensors",
         "encoder.layer.21.attention.self.query.bias": "model.safetensors",
         "encoder.layer.21.attention.self.query.weight": "model.safetensors",
         "encoder.layer.21.attention.self.value.bias": "model.safetensors",
         "encoder.layer.21.attention.self.value.weight": "model.safetensors",
         "encoder.layer.21.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.21.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.21.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.21.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.21.output.dense.bias": "model.safetensors",
         "encoder.layer.21.output.dense.weight": "model.safetensors",
         "encoder.layer.22.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.22.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.22.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.22.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.22.attention.self.key.bias": "model.safetensors",
         "encoder.layer.22.attention.self.key.weight": "model.safetensors",
         "encoder.layer.22.attention.self.query.bias": "model.safetensors",
         "encoder.layer.22.attention.self.query.weight": "model.safetensors",
         "encoder.layer.22.attention.self.value.bias": "model.safetensors",
         "encoder.layer.22.attention.self.value.weight": "model.safetensors",
         "encoder.layer.22.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.22.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.22.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.22.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.22.output.dense.bias": "model.safetensors",
         "encoder.layer.22.output.dense.weight": "model.safetensors",
         "encoder.layer.23.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.23.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.23.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.23.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.23.attention.self.key.bias": "model.safetensors",
         "encoder.layer.23.attention.self.key.weight": "model.safetensors",
         "encoder.layer.23.attention.self.query.bias": "model.safetensors",
         "encoder.layer.23.attention.self.query.weight": "model.safetensors",
         "encoder.layer.23.attention.self.value.bias": "model.safetensors",
         "encoder.layer.23.attention.self.value.weight": "model.safetensors",
         "encoder.layer.23.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.23.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.23.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.23.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.23.output.dense.bias": "model.safetensors",
         "encoder.layer.23.output.dense.weight": "model.safetensors",
         "encoder.layer.3.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.3.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.3.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.3.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.3.attention.self.key.bias": "model.safetensors",
         "encoder.layer.3.attention.self.key.weight": "model.safetensors",
         "encoder.layer.3.attention.self.query.bias": "model.safetensors",
         "encoder.layer.3.attention.self.query.weight": "model.safetensors",
         "encoder.layer.3.attention.self.value.bias": "model.safetensors",
         "encoder.layer.3.attention.self.value.weight": "model.safetensors",
         "encoder.layer.3.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.3.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.3.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.3.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.3.output.dense.bias": "model.safetensors",
         "encoder.layer.3.output.dense.weight": "model.safetensors",
         "encoder.layer.4.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.4.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.4.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.4.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.4.attention.self.key.bias": "model.safetensors",
         "encoder.layer.4.attention.self.key.weight": "model.safetensors",
         "encoder.layer.4.attention.self.query.bias": "model.safetensors",
         "encoder.layer.4.attention.self.query.weight": "model.safetensors",
         "encoder.layer.4.attention.self.value.bias": "model.safetensors",
         "encoder.layer.4.attention.self.value.weight": "model.safetensors",
         "encoder.layer.4.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.4.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.4.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.4.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.4.output.dense.bias": "model.safetensors",
         "encoder.layer.4.output.dense.weight": "model.safetensors",
         "encoder.layer.5.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.5.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.5.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.5.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.5.attention.self.key.bias": "model.safetensors",
         "encoder.layer.5.attention.self.key.weight": "model.safetensors",
         "encoder.layer.5.attention.self.query.bias": "model.safetensors",
         "encoder.layer.5.attention.self.query.weight": "model.safetensors",
         "encoder.layer.5.attention.self.value.bias": "model.safetensors",
         "encoder.layer.5.attention.self.value.weight": "model.safetensors",
         "encoder.layer.5.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.5.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.5.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.5.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.5.output.dense.bias": "model.safetensors",
         "encoder.layer.5.output.dense.weight": "model.safetensors",
         "encoder.layer.6.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.6.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.6.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.6.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.6.attention.self.key.bias": "model.safetensors",
         "encoder.layer.6.attention.self.key.weight": "model.safetensors",
         "encoder.layer.6.attention.self.query.bias": "model.safetensors",
         "encoder.layer.6.attention.self.query.weight": "model.safetensors",
         "encoder.layer.6.attention.self.value.bias": "model.safetensors",
         "encoder.layer.6.attention.self.value.weight": "model.safetensors",
         "encoder.layer.6.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.6.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.6.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.6.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.6.output.dense.bias": "model.safetensors",
         "encoder.layer.6.output.dense.weight": "model.safetensors",
         "encoder.layer.7.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.7.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.7.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.7.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.7.attention.self.key.bias": "model.safetensors",
         "encoder.layer.7.attention.self.key.weight": "model.safetensors",
         "encoder.layer.7.attention.self.query.bias": "model.safetensors",
         "encoder.layer.7.attention.self.query.weight": "model.safetensors",
         "encoder.layer.7.attention.self.value.bias": "model.safetensors",
         "encoder.layer.7.attention.self.value.weight": "model.safetensors",
         "encoder.layer.7.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.7.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.7.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.7.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.7.output.dense.bias": "model.safetensors",
         "encoder.layer.7.output.dense.weight": "model.safetensors",
         "encoder.layer.8.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.8.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.8.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.8.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.8.attention.self.key.bias": "model.safetensors",
         "encoder.layer.8.attention.self.key.weight": "model.safetensors",
         "encoder.layer.8.attention.self.query.bias": "model.safetensors",
         "encoder.layer.8.attention.self.query.weight": "model.safetensors",
         "encoder.layer.8.attention.self.value.bias": "model.safetensors",
         "encoder.layer.8.attention.self.value.weight": "model.safetensors",
         "encoder.layer.8.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.8.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.8.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.8.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.8.output.dense.bias": "model.safetensors",
         "encoder.layer.8.output.dense.weight": "model.safetensors",
         "encoder.layer.9.attention.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.9.attention.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.9.attention.output.dense.bias": "model.safetensors",
         "encoder.layer.9.attention.output.dense.weight": "model.safetensors",
         "encoder.layer.9.attention.self.key.bias": "model.safetensors",
         "encoder.layer.9.attention.self.key.weight": "model.safetensors",
         "encoder.layer.9.attention.self.query.bias": "model.safetensors",
         "encoder.layer.9.attention.self.query.weight": "model.safetensors",
         "encoder.layer.9.attention.self.value.bias": "model.safetensors",
         "encoder.layer.9.attention.self.value.weight": "model.safetensors",
         "encoder.layer.9.intermediate.dense.bias": "model.safetensors",
         "encoder.layer.9.intermediate.dense.weight": "model.safetensors",
         "encoder.layer.9.output.LayerNorm.bias": "model.safetensors",
         "encoder.layer.9.output.LayerNorm.weight": "model.safetensors",
         "encoder.layer.9.output.dense.bias": "model.safetensors",
         "encoder.layer.9.output.dense.weight": "model.safetensors",
         "pooler.dense.bias": "model.safetensors",
         "pooler.dense.weight": "model.safetensors"
     }
 }