fxmarty
/

llama-tiny-w-fp8-a-fp8-o-fp8

fxmarty commited on Oct 22, 2024

Commit

cde8faf

verified ·

1 Parent(s): b6d34c3

Upload config.json with huggingface_hub

Files changed (1) hide show

config.json CHANGED Viewed

@@ -26,7 +26,6 @@
       "lm_head"
     ],
     "export": {
-      "custom_mode": "fp8",
       "kv_cache_group": [],
       "pack_method": "reorder",
       "weight_format": "real_quantized",
@@ -73,14 +72,14 @@
     "layer_type_quant_config": {},
     "pack_method": "reorder",
     "quant_method": "quark",
-    "quant_mode": 1
   },
   "rms_norm_eps": 1e-06,
   "rope_scaling": null,
   "rope_theta": 10000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
-  "transformers_version": "4.46.0.dev0",
   "use_cache": true,
   "vocab_size": 32000
 }

       "lm_head"
     ],
     "export": {
       "kv_cache_group": [],
       "pack_method": "reorder",
       "weight_format": "real_quantized",
     "layer_type_quant_config": {},
     "pack_method": "reorder",
     "quant_method": "quark",
+    "quant_mode": "eager_mode"
   },
   "rms_norm_eps": 1e-06,
   "rope_scaling": null,
   "rope_theta": 10000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
+  "transformers_version": "4.45.2",
   "use_cache": true,
   "vocab_size": 32000
 }