nm-testing
/

TinyLlama-1.1B-Chat-v1.0-W8A8_tensor_weight_static_per_tensor_act-e2e

8-bit precision

compressed-tensors

Model card Files Files and versions

nm-autobot commited on 24 days ago

Commit

2fa8fda

·

verified ·

1 Parent(s): 1a9651a

Upload folder using huggingface_hub

Files changed (3) hide show

config.json +2 -1
model.safetensors +1 -1
recipe.yaml +1 -0

config.json CHANGED Viewed

@@ -21,6 +21,7 @@
   "quantization_config": {
     "config_groups": {
       "group_0": {
         "input_activations": {
           "actorder": null,
           "block_structure": null,
@@ -61,7 +62,7 @@
     "quantization_status": "compressed",
     "sparsity_config": {},
     "transform_config": {},
-    "version": "0.10.3.a20250812"
   },
   "rms_norm_eps": 1e-05,
   "rope_scaling": null,

   "quantization_config": {
     "config_groups": {
       "group_0": {
+        "format": "int-quantized",
         "input_activations": {
           "actorder": null,
           "block_structure": null,
     "quantization_status": "compressed",
     "sparsity_config": {},
     "transform_config": {},
+    "version": "0.10.3.a20250815"
   },
   "rms_norm_eps": 1e-05,
   "rope_scaling": null,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f40538be619454c2d887be5f2447e445e79c8b93291fb2e6a2ffb09bd1f4db86
 size 1231270112

 version https://git-lfs.github.com/spec/v1
+oid sha256:83e2783c4828fbd132d1da1ec583cf0e080964be2c7c7dd0d77ee0caab23c0d9
 size 1231270112

recipe.yaml CHANGED Viewed

@@ -37,5 +37,6 @@ quant_stage:
             observer: minmax
             observer_kwargs: {}
           output_activations: null
       targets: [Linear]
       ignore: [lm_head]

             observer: minmax
             observer_kwargs: {}
           output_activations: null
+          format: null
       targets: [Linear]
       ignore: [lm_head]