RedHatAI
/

Qwen2-VL-72B-Instruct-quantized.w4a16

text-generation-inference

compressed-tensors

Model card Files Files and versions

shubhrapandit commited on Feb 26

Commit

c9377ae

·

verified ·

1 Parent(s): 1fb421c

Update README.md

Files changed (1) hide show

README.md +64 -0

README.md CHANGED Viewed

@@ -239,6 +239,70 @@ lm_eval \
 ### Accuracy
 ## Inference Performance

 ### Accuracy
+<table>
+  <thead>
+    <tr>
+      <th>Category</th>
+      <th>Metric</th>
+      <th>Qwen/Qwen2-VL-72B-Instruct</th>
+      <th>nm-testing/Qwen2-VL-72B-Instruct-quantized.W4A16</th>
+      <th>Recovery (%)</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <td rowspan="6"><b>Vision</b></td>
+      <td>MMMU (val, CoT)<br><i>explicit_prompt_relaxed_correctness</i></td>
+      <td>62.11</td>
+      <td>60.11</td>
+      <td>96.78%</td>
+    </tr>
+    <tr>
+      <td>VQAv2 (val)<br><i>vqa_match</i></td>
+      <td>82.51</td>
+      <td>82.38</td>
+      <td>99.84%</td>
+    </tr>
+    <tr>
+      <td>DocVQA (val)<br><i>anls</i></td>
+      <td>95.01</td>
+      <td>94.94</td>
+      <td>99.93%</td>
+    </tr>
+    <tr>
+      <td>ChartQA (test, CoT)<br><i>anywhere_in_answer_relaxed_correctness</i></td>
+      <td>83.40</td>
+      <td>80.72</td>
+      <td>96.78%</td>
+    </tr>
+    <tr>
+      <td>Mathvista (testmini, CoT)<br><i>explicit_prompt_relaxed_correctness</i></td>
+      <td>66.57</td>
+      <td>64.66</td>
+      <td>97.13%</td>
+    </tr>
+    <tr>
+      <td><b>Average Score</b></td>
+      <td><b>77.12</b></td>
+      <td><b>—</b></td>
+      <td><b>—</b></td>
+    </tr>
+    <tr>
+      <td rowspan="2"><b>Text</b></td>
+      <td>MGSM (CoT)</td>
+      <td>68.60</td>
+      <td>66.45</td>
+      <td>96.87%</td>
+    </tr>
+    <tr>
+      <td>MMLU (5-shot)</td>
+      <td>82.70</td>
+      <td>82.35</td>
+      <td>99.58%</td>
+    </tr>
+  </tbody>
+</table>
 ## Inference Performance