RobAgrees
/

quantized-dia-1.6B-int8

model_hub_mixin

pytorch_model_hub_mixin

Model card Files Files and versions Community

RobAgrees commited on Apr 29

Commit

ee8e7fd

·

verified ·

1 Parent(s): 9b3d8a4

add config.json, readme.md

Files changed (2) hide show

config.json +6 -0
readme.md +11 -0

config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "model_type": "dia",
+  "quantized": true,
+  "quantization_type": "dynamic",
+  "original_model": "nari-labs/Dia-1.6B"
+}

readme.md ADDED Viewed

	@@ -0,0 +1,11 @@

+# Quantized Dia 1.6B (INT8)
+This is a dynamic int8 quantized version of [nari-labs/Dia-1.6B](https://huggingface.co/nari-labs/Dia-1.6B).
+It uses dynamic quantization for lighter deployment and faster inference.
+Original model: **float16**, ~6.4GB
+Quantized model: **int8 dynamic**, ~6.4GB
+Uploaded by [RobertAgee](https://github.com/RobertAgee) and [RobAgrees](https://huggingface.co/RobAgrees.
+> Quantized automatically with PyTorch dynamic quantization in Google Colab.