qualcomm
/

Stable-Diffusion-v2.1

@@ -1,9 +1,8 @@
 ---
 library_name: pytorch
-license: creativeml-openrail-m
 tags:
 - generative_ai
-- quantized
 - android
 pipeline_tag: unconditional-image-generation
@@ -27,7 +26,7 @@ More details on model performance across various devices, can be found
 ### Model Details
-- **Model Type:** Image generation
 - **Model Stats:**
   - Input: Text prompt to generate image
   - Text Encoder Number of parameters: 340M
@@ -35,41 +34,53 @@ More details on model performance across various devices, can be found
   - VAE Decoder Number of parameters: 83M
   - Model size: 1GB
-| Model | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Precision | Primary Compute Unit | Target Model
 |---|---|---|---|---|---|---|---|---|
-| TextEncoderQuantizable | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | QNN | 6.666 ms | 0 - 3 MB | W8A16 | NPU | [Stable-Diffusion-v2.1.so](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/TextEncoderQuantizable.so) |
-| TextEncoderQuantizable | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | QNN | 4.647 ms | 0 - 20 MB | W8A16 | NPU | [Stable-Diffusion-v2.1.so](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/TextEncoderQuantizable.so) |
-| TextEncoderQuantizable | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | QNN | 4.2 ms | 0 - 15 MB | W8A16 | NPU | Use Export Script |
-| TextEncoderQuantizable | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 6.84 ms | 0 - 0 MB | W8A16 | NPU | Use Export Script |
-| TextEncoderQuantizable | SA7255P ADP | SA7255P | QNN | 88.113 ms | 0 - 9 MB | W8A16 | NPU | Use Export Script |
-| TextEncoderQuantizable | SA8255 (Proxy) | SA8255P Proxy | QNN | 6.62 ms | 0 - 3 MB | W8A16 | NPU | Use Export Script |
-| TextEncoderQuantizable | SA8650 (Proxy) | SA8650P Proxy | QNN | 6.654 ms | 0 - 2 MB | W8A16 | NPU | Use Export Script |
-| TextEncoderQuantizable | SA8775P ADP | SA8775P | QNN | 7.869 ms | 0 - 10 MB | W8A16 | NPU | Use Export Script |
-| TextEncoderQuantizable | QCS8275 (Proxy) | QCS8275 Proxy | QNN | 88.113 ms | 0 - 9 MB | W8A16 | NPU | Use Export Script |
-| TextEncoderQuantizable | QCS8550 (Proxy) | QCS8550 Proxy | QNN | 6.636 ms | 0 - 3 MB | W8A16 | NPU | Use Export Script |
-| TextEncoderQuantizable | QCS9075 (Proxy) | QCS9075 Proxy | QNN | 7.869 ms | 0 - 10 MB | W8A16 | NPU | Use Export Script |
-| UnetQuantizable | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | QNN | 96.977 ms | 0 - 3 MB | W8A16 | NPU | [Stable-Diffusion-v2.1.so](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/UnetQuantizable.so) |
-| UnetQuantizable | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | QNN | 69.178 ms | 0 - 17 MB | W8A16 | NPU | [Stable-Diffusion-v2.1.so](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/UnetQuantizable.so) |
-| UnetQuantizable | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | QNN | 61.668 ms | 0 - 14 MB | W8A16 | NPU | Use Export Script |
-| UnetQuantizable | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 99.461 ms | 0 - 0 MB | W8A16 | NPU | Use Export Script |
-| UnetQuantizable | SA7255P ADP | SA7255P | QNN | 1467.935 ms | 0 - 7 MB | W8A16 | NPU | Use Export Script |
-| UnetQuantizable | SA8255 (Proxy) | SA8255P Proxy | QNN | 98.746 ms | 0 - 2 MB | W8A16 | NPU | Use Export Script |
-| UnetQuantizable | SA8650 (Proxy) | SA8650P Proxy | QNN | 97.177 ms | 1 - 3 MB | W8A16 | NPU | Use Export Script |
-| UnetQuantizable | SA8775P ADP | SA8775P | QNN | 110.665 ms | 0 - 8 MB | W8A16 | NPU | Use Export Script |
-| UnetQuantizable | QCS8275 (Proxy) | QCS8275 Proxy | QNN | 1467.935 ms | 0 - 7 MB | W8A16 | NPU | Use Export Script |
-| UnetQuantizable | QCS8550 (Proxy) | QCS8550 Proxy | QNN | 97.457 ms | 0 - 3 MB | W8A16 | NPU | Use Export Script |
-| UnetQuantizable | QCS9075 (Proxy) | QCS9075 Proxy | QNN | 110.665 ms | 0 - 8 MB | W8A16 | NPU | Use Export Script |
-| VaeDecoderQuantizable | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | QNN | 295.307 ms | 0 - 71 MB | W8A16 | NPU | [Stable-Diffusion-v2.1.so](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/VaeDecoderQuantizable.so) |
-| VaeDecoderQuantizable | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | QNN | 223.33 ms | 0 - 312 MB | W8A16 | NPU | [Stable-Diffusion-v2.1.so](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/VaeDecoderQuantizable.so) |
-| VaeDecoderQuantizable | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | QNN | 189.418 ms | 0 - 356 MB | W8A16 | NPU | Use Export Script |
-| VaeDecoderQuantizable | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 267.095 ms | 0 - 0 MB | W8A16 | NPU | Use Export Script |
-| VaeDecoderQuantizable | SA7255P ADP | SA7255P | QNN | 4460.526 ms | 0 - 10 MB | W8A16 | NPU | Use Export Script |
-| VaeDecoderQuantizable | SA8255 (Proxy) | SA8255P Proxy | QNN | 274.71 ms | 0 - 2 MB | W8A16 | NPU | Use Export Script |
-| VaeDecoderQuantizable | SA8650 (Proxy) | SA8650P Proxy | QNN | 269.652 ms | 0 - 2 MB | W8A16 | NPU | Use Export Script |
-| VaeDecoderQuantizable | SA8775P ADP | SA8775P | QNN | 301.141 ms | 0 - 10 MB | W8A16 | NPU | Use Export Script |
-| VaeDecoderQuantizable | QCS8275 (Proxy) | QCS8275 Proxy | QNN | 4460.526 ms | 0 - 10 MB | W8A16 | NPU | Use Export Script |
-| VaeDecoderQuantizable | QCS8550 (Proxy) | QCS8550 Proxy | QNN | 271.222 ms | 0 - 3 MB | W8A16 | NPU | Use Export Script |
-| VaeDecoderQuantizable | QCS9075 (Proxy) | QCS9075 Proxy | QNN | 301.141 ms | 0 - 10 MB | W8A16 | NPU | Use Export Script |
@@ -79,7 +90,7 @@ More details on model performance across various devices, can be found
 Install the package via pip:
 ```bash
-pip install "qai-hub-models[stable-diffusion-v2-1-quantized]" -f https://qaihub-public-python-wheels.s3.us-west-2.amazonaws.com/index.html
 ```
@@ -131,30 +142,30 @@ python -m qai_hub_models.models.stable_diffusion_v2_1_quantized.export
 Profiling Results
 ------------------------------------------------------------
 TextEncoderQuantizable
-Device                          : Samsung Galaxy S23 (13)
-Runtime                         : QNN
-Estimated inference time (ms)   : 6.7
-Estimated peak memory usage (MB): [0, 3]
-Total # Ops                     : 787
-Compute Unit(s)                 : NPU (787 ops)
 ------------------------------------------------------------
 UnetQuantizable
-Device                          : Samsung Galaxy S23 (13)
-Runtime                         : QNN
-Estimated inference time (ms)   : 97.0
-Estimated peak memory usage (MB): [0, 3]
-Total # Ops                     : 5891
-Compute Unit(s)                 : NPU (5891 ops)
 ------------------------------------------------------------
 VaeDecoderQuantizable
-Device                          : Samsung Galaxy S23 (13)
-Runtime                         : QNN
-Estimated inference time (ms)   : 295.3
-Estimated peak memory usage (MB): [0, 71]
-Total # Ops                     : 189
-Compute Unit(s)                 : NPU (189 ops)
 ```

 ---
 library_name: pytorch
+license: other
 tags:
 - generative_ai
 - android
 pipeline_tag: unconditional-image-generation
 ### Model Details
+- **Model Type:** Model_use_case.image_generation
 - **Model Stats:**
   - Input: Text prompt to generate image
   - Text Encoder Number of parameters: 340M
   - VAE Decoder Number of parameters: 83M
   - Model size: 1GB
+| Model | Precision | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Primary Compute Unit | Target Model
 |---|---|---|---|---|---|---|---|---|
+| TextEncoderQuantizable | w8a16 | QCS8275 (Proxy) | Qualcomm® QCS8275 (Proxy) | QNN | 15.92 ms | 0 - 9 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | QCS8550 (Proxy) | Qualcomm® QCS8550 (Proxy) | QNN | 6.594 ms | 0 - 2 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | QCS9075 (Proxy) | Qualcomm® QCS9075 (Proxy) | QNN | 6.814 ms | 0 - 9 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | SA7255P ADP | Qualcomm® SA7255P | QNN | 15.92 ms | 0 - 9 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | SA8255 (Proxy) | Qualcomm® SA8255P (Proxy) | QNN | 6.634 ms | 0 - 3 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | SA8650 (Proxy) | Qualcomm® SA8650P (Proxy) | QNN | 6.813 ms | 0 - 2 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | SA8775P ADP | Qualcomm® SA8775P | QNN | 6.814 ms | 0 - 9 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 Mobile | QNN | 6.632 ms | 0 - 3 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 Mobile | ONNX | 6.859 ms | 0 - 386 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| TextEncoderQuantizable | w8a16 | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 Mobile | QNN | 4.62 ms | 0 - 19 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 Mobile | ONNX | 5.075 ms | 0 - 14 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| TextEncoderQuantizable | w8a16 | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite Mobile | QNN | 4.173 ms | 0 - 14 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite Mobile | ONNX | 4.499 ms | 0 - 13 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| TextEncoderQuantizable | w8a16 | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 6.834 ms | 0 - 0 MB | NPU | Use Export Script |
+| TextEncoderQuantizable | w8a16 | Snapdragon X Elite CRD | Snapdragon® X Elite | ONNX | 6.823 ms | 378 - 378 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| UnetQuantizable | w8a16 | QCS8275 (Proxy) | Qualcomm® QCS8275 (Proxy) | QNN | 241.358 ms | 0 - 8 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | QCS8550 (Proxy) | Qualcomm® QCS8550 (Proxy) | QNN | 97.192 ms | 0 - 3 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | QCS9075 (Proxy) | Qualcomm® QCS9075 (Proxy) | QNN | 92.111 ms | 0 - 8 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | SA7255P ADP | Qualcomm® SA7255P | QNN | 241.358 ms | 0 - 8 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | SA8255 (Proxy) | Qualcomm® SA8255P (Proxy) | QNN | 97.903 ms | 0 - 3 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | SA8650 (Proxy) | Qualcomm® SA8650P (Proxy) | QNN | 96.775 ms | 0 - 2 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | SA8775P ADP | Qualcomm® SA8775P | QNN | 92.111 ms | 0 - 8 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 Mobile | QNN | 97.437 ms | 0 - 5 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 Mobile | ONNX | 98.551 ms | 0 - 3 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| UnetQuantizable | w8a16 | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 Mobile | QNN | 69.198 ms | 0 - 19 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 Mobile | ONNX | 69.745 ms | 0 - 17 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| UnetQuantizable | w8a16 | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite Mobile | QNN | 61.688 ms | 0 - 14 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite Mobile | ONNX | 62.663 ms | 0 - 14 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| UnetQuantizable | w8a16 | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 98.945 ms | 0 - 0 MB | NPU | Use Export Script |
+| UnetQuantizable | w8a16 | Snapdragon X Elite CRD | Snapdragon® X Elite | ONNX | 99.538 ms | 842 - 842 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| VaeDecoderQuantizable | w8a16 | QCS8275 (Proxy) | Qualcomm® QCS8275 (Proxy) | QNN | 720.835 ms | 1 - 10 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | QCS8550 (Proxy) | Qualcomm® QCS8550 (Proxy) | QNN | 270.663 ms | 0 - 3 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | QCS9075 (Proxy) | Qualcomm® QCS9075 (Proxy) | QNN | 250.403 ms | 0 - 12 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | SA7255P ADP | Qualcomm® SA7255P | QNN | 720.835 ms | 1 - 10 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | SA8255 (Proxy) | Qualcomm® SA8255P (Proxy) | QNN | 271.924 ms | 0 - 3 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | SA8650 (Proxy) | Qualcomm® SA8650P (Proxy) | QNN | 274.917 ms | 0 - 2 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | SA8775P ADP | Qualcomm® SA8775P | QNN | 250.403 ms | 0 - 12 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 Mobile | QNN | 269.888 ms | 0 - 3 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 Mobile | ONNX | 269.758 ms | 0 - 66 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| VaeDecoderQuantizable | w8a16 | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 Mobile | QNN | 203.298 ms | 0 - 20 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 Mobile | ONNX | 204.412 ms | 3 - 22 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| VaeDecoderQuantizable | w8a16 | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite Mobile | QNN | 193.019 ms | 0 - 15 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite Mobile | ONNX | 188.783 ms | 3 - 17 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
+| VaeDecoderQuantizable | w8a16 | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 266.283 ms | 0 - 0 MB | NPU | Use Export Script |
+| VaeDecoderQuantizable | w8a16 | Snapdragon X Elite CRD | Snapdragon® X Elite | ONNX | 266.925 ms | 63 - 63 MB | NPU | [Stable-Diffusion-v2.1.onnx](https://huggingface.co/qualcomm/Stable-Diffusion-v2.1/blob/main/Stable-Diffusion-v2.1_w8a16.onnx) |
 Install the package via pip:
 ```bash
+pip install "qai-hub-models[stable-diffusion-v2-1-quantized]"
 ```
 Profiling Results
 ------------------------------------------------------------
 TextEncoderQuantizable
+Device                          : cs_8275 (ANDROID 14)
+Runtime                         : QNN
+Estimated inference time (ms)   : 15.9
+Estimated peak memory usage (MB): [0, 9]
+Total # Ops                     : 971
+Compute Unit(s)                 : npu (971 ops) gpu (0 ops) cpu (0 ops)
 ------------------------------------------------------------
 UnetQuantizable
+Device                          : cs_8275 (ANDROID 14)
+Runtime                         : QNN
+Estimated inference time (ms)   : 241.4
+Estimated peak memory usage (MB): [0, 8]
+Total # Ops                     : 5783
+Compute Unit(s)                 : npu (5783 ops) gpu (0 ops) cpu (0 ops)
 ------------------------------------------------------------
 VaeDecoderQuantizable
+Device                          : cs_8275 (ANDROID 14)
+Runtime                         : QNN
+Estimated inference time (ms)   : 720.8
+Estimated peak memory usage (MB): [1, 10]
+Total # Ops                     : 189
+Compute Unit(s)                 : npu (189 ops) gpu (0 ops) cpu (0 ops)
 ```