diff --git "a/eval_mm_niah/reasoning-image-test.log" "b/eval_mm_niah/reasoning-image-test.log"
deleted file mode 100644--- "a/eval_mm_niah/reasoning-image-test.log"
+++ /dev/null
@@ -1,3029 +0,0 @@
-language_model.model.layers.0 4
-language_model.model.layers.1 4
-language_model.model.layers.2 4
-language_model.model.layers.3 4
-language_model.model.layers.4 4
-language_model.model.layers.5 4
-language_model.model.layers.6 4
-language_model.model.layers.7 4
-language_model.model.layers.8 4
-language_model.model.layers.9 4
-language_model.model.layers.10 4
-language_model.model.layers.11 4
-language_model.model.layers.12 4
-language_model.model.layers.13 4
-language_model.model.layers.14 4
-language_model.model.layers.15 4
-language_model.model.layers.16 4
-language_model.model.layers.17 4
-language_model.model.layers.18 4
-language_model.model.layers.19 4
-language_model.model.layers.20 4
-language_model.model.layers.21 4
-language_model.model.layers.22 4
-language_model.model.layers.23 4
-vision_model.encoder.layers.0 0
-vision_model.encoder.layers.1 0
-vision_model.encoder.layers.2 0
-vision_model.encoder.layers.3 0
-vision_model.encoder.layers.4 0
-vision_model.encoder.layers.5 0
-vision_model.encoder.layers.6 0
-vision_model.encoder.layers.7 0
-vision_model.encoder.layers.8 0
-vision_model.encoder.layers.9 0
-vision_model.encoder.layers.10 0
-vision_model.encoder.layers.11 0
-vision_model.encoder.layers.12 0
-vision_model.encoder.layers.13 0
-vision_model.encoder.layers.14 0
-vision_model.encoder.layers.15 0
-vision_model.encoder.layers.16 0
-vision_model.encoder.layers.17 0
-vision_model.encoder.layers.18 0
-vision_model.encoder.layers.19 0
-vision_model.encoder.layers.20 0
-vision_model.encoder.layers.21 0
-vision_model.encoder.layers.22 0
-vision_model.encoder.layers.23 0
-vision_model.embeddings 0
-mlp1 0
-language_model.model.tok_embeddings 4
-language_model.model.norm 4
-language_model.output 4
-language_model.model.embed_tokens 4
-language_model.lm_head 4
-The argument `trust_remote_code` is to be used with Auto classes. It has no effect here and is ignored.
-The argument `trust_remote_code` is to be used with Auto classes. It has no effect here and is ignored.
-The argument `trust_remote_code` is to be used with Auto classes. It has no effect here and is ignored.
-The argument `trust_remote_code` is to be used with Auto classes. It has no effect here and is ignored.
-Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
-Rank [3] Begin to eval model work_dirs/share_internvl/InternVL2-2B on task reasoning-image-test, devices: {device(type='cuda', index=3), device(type='cuda', index=7)}
-Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
-Rank [0] Begin to eval model work_dirs/share_internvl/InternVL2-2B on task reasoning-image-test, devices: {device(type='cuda', index=0), device(type='cuda', index=4)}
-Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
-Rank [2] Begin to eval model work_dirs/share_internvl/InternVL2-2B on task reasoning-image-test, devices: {device(type='cuda', index=2), device(type='cuda', index=6)}
-Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
-Rank [1] Begin to eval model work_dirs/share_internvl/InternVL2-2B on task reasoning-image-test, devices: {device(type='cuda', index=1), device(type='cuda', index=5)}
-Rank 2 len(skip_idx)=0
-Rank 3 len(skip_idx)=0
-Rank 0 len(skip_idx)=0
-Rank 1 len(skip_idx)=0
-[2024-08-03 15:13:16] [Rank 2] totoal_tokens=770, outputs='A'
-[2024-08-03 15:13:16] [Rank 1] totoal_tokens=770, outputs='A'
-[2024-08-03 15:13:16] [Rank 3] totoal_tokens=770, outputs='A'
-[2024-08-03 15:13:16] [Rank 0] totoal_tokens=837, outputs='A'
-[2024-08-03 15:13:17] [Rank 1] totoal_tokens=887, outputs='A'
-[2024-08-03 15:13:17] [Rank 2] totoal_tokens=802, outputs='A'
-[2024-08-03 15:13:17] [Rank 3] totoal_tokens=802, outputs='A'
-[2024-08-03 15:13:17] [Rank 0] totoal_tokens=837, outputs='A'
-[2024-08-03 15:13:17] [Rank 1] totoal_tokens=966, outputs='A'
-[2024-08-03 15:13:17] [Rank 2] totoal_tokens=827, outputs='A'
-[2024-08-03 15:13:17] [Rank 0] totoal_tokens=837, outputs='A'
-[2024-08-03 15:13:17] [Rank 3] totoal_tokens=827, outputs='A'
-[2024-08-03 15:13:17] [Rank 1] totoal_tokens=968, outputs='A'
-[2024-08-03 15:13:17] [Rank 2] totoal_tokens=946, outputs='A'
-[2024-08-03 15:13:17] [Rank 0] totoal_tokens=858, outputs='A'
-[2024-08-03 15:13:17] [Rank 3] totoal_tokens=852, outputs='A'
-[2024-08-03 15:13:17] [Rank 1] totoal_tokens=975, outputs='A'
-[2024-08-03 15:13:17] [Rank 2] totoal_tokens=950, outputs='A'
-[2024-08-03 15:13:17] [Rank 0] totoal_tokens=946, outputs='A'
-[2024-08-03 15:13:17] [Rank 3] totoal_tokens=981, outputs='A'
-[2024-08-03 15:13:18] [Rank 1] totoal_tokens=1003, outputs='A'
-[2024-08-03 15:13:18] [Rank 2] totoal_tokens=964, outputs='A'
-[2024-08-03 15:13:18] [Rank 0] totoal_tokens=964, outputs='A'
-[2024-08-03 15:13:18] [Rank 3] totoal_tokens=981, outputs='A'
-[2024-08-03 15:13:18] [Rank 1] totoal_tokens=1050, outputs='A'
-[2024-08-03 15:13:18] [Rank 2] totoal_tokens=966, outputs='A'
-[2024-08-03 15:13:18] [Rank 0] totoal_tokens=1018, outputs='A'
-[2024-08-03 15:13:18] [Rank 3] totoal_tokens=994, outputs='A'
-[2024-08-03 15:13:18] [Rank 1] totoal_tokens=1082, outputs='A'
-[2024-08-03 15:13:18] [Rank 2] totoal_tokens=966, outputs='A'
-[2024-08-03 15:13:18] [Rank 3] totoal_tokens=1025, outputs='A'
-[2024-08-03 15:13:18] [Rank 0] totoal_tokens=1082, outputs='A'
-[2024-08-03 15:13:18] [Rank 1] totoal_tokens=1107, outputs='A'
-[2024-08-03 15:13:18] [Rank 2] totoal_tokens=981, outputs='A'
-[2024-08-03 15:13:18] [Rank 3] totoal_tokens=1050, outputs='A'
-[2024-08-03 15:13:18] [Rank 0] totoal_tokens=1082, outputs='A'
-[2024-08-03 15:13:18] [Rank 1] totoal_tokens=1149, outputs='A'
-[2024-08-03 15:13:18] [Rank 2] totoal_tokens=994, outputs='A'
-[2024-08-03 15:13:18] [Rank 3] totoal_tokens=1060, outputs='A'
-[2024-08-03 15:13:18] [Rank 0] totoal_tokens=1085, outputs='A'
-Processing InternVL2-2B_reasoning-image-test.jsonl:   0%|          | 0/734 [00:00<?, ?it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   0%|          | 1/734 [00:01<16:02,  1.31s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:   0%|          | 2/734 [00:01<10:38,  1.15it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   0%|          | 3/734 [00:02<06:48,  1.79it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   1%|          | 4/734 [00:02<04:52,  2.50it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   1%|          | 5/734 [00:02<03:45,  3.23it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   1%|          | 6/734 [00:02<03:04,  3.94it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   1%|          | 7/734 [00:02<02:40,  4.52it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   1%|          | 8/734 [00:02<02:28,  4.88it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   1%|          | 9/734 [00:03<02:21,  5.11it/s]Processing InternVL2-2B_reasoni[2024-08-03 15:13:18] [Rank 1] totoal_tokens=1170, outputs='A'
-[2024-08-03 15:13:18] [Rank 2] totoal_tokens=994, outputs='A'
-[2024-08-03 15:13:18] [Rank 3] totoal_tokens=1060, outputs='A'
-[2024-08-03 15:13:18] [Rank 0] totoal_tokens=1118, outputs='A'
-[2024-08-03 15:13:18] [Rank 1] totoal_tokens=1206, outputs='A'
-[2024-08-03 15:13:18] [Rank 2] totoal_tokens=994, outputs='A'
-[2024-08-03 15:13:18] [Rank 3] totoal_tokens=1060, outputs='A'
-[2024-08-03 15:13:19] [Rank 0] totoal_tokens=1120, outputs='A'
-[2024-08-03 15:13:19] [Rank 1] totoal_tokens=1206, outputs='A'
-[2024-08-03 15:13:19] [Rank 2] totoal_tokens=1028, outputs='A'
-[2024-08-03 15:13:19] [Rank 3] totoal_tokens=1082, outputs='A'
-[2024-08-03 15:13:19] [Rank 0] totoal_tokens=1149, outputs='A'
-[2024-08-03 15:13:19] [Rank 2] totoal_tokens=1044, outputs='A'
-[2024-08-03 15:13:19] [Rank 1] totoal_tokens=1208, outputs='A'
-[2024-08-03 15:13:19] [Rank 3] totoal_tokens=1082, outputs='A'
-[2024-08-03 15:13:19] [Rank 0] totoal_tokens=1156, outputs='A'
-[2024-08-03 15:13:19] [Rank 1] totoal_tokens=1219, outputs='A'
-[2024-08-03 15:13:19] [Rank 2] totoal_tokens=1060, outputs='A'
-[2024-08-03 15:13:19] [Rank 3] totoal_tokens=1107, outputs='A'
-[2024-08-03 15:13:19] [Rank 0] totoal_tokens=1170, outputs='A'
-[2024-08-03 15:13:19] [Rank 2] totoal_tokens=1060, outputs='A'
-[2024-08-03 15:13:19] [Rank 1] totoal_tokens=1221, outputs='A'
-[2024-08-03 15:13:19] [Rank 3] totoal_tokens=1118, outputs='A'
-[2024-08-03 15:13:19] [Rank 0] totoal_tokens=1170, outputs='A'
-[2024-08-03 15:13:19] [Rank 2] totoal_tokens=1060, outputs='A'
-[2024-08-03 15:13:19] [Rank 1] totoal_tokens=1231, outputs='A'
-[2024-08-03 15:13:19] [Rank 3] totoal_tokens=1120, outputs='A'
-[2024-08-03 15:13:19] [Rank 0] totoal_tokens=1210, outputs='A'
-[2024-08-03 15:13:20] [Rank 2] totoal_tokens=1082, outputs='A'
-[2024-08-03 15:13:20] [Rank 0] totoal_tokens=1219, outputs='A'
-[2024-08-03 15:13:20] [Rank 1] totoal_tokens=1231, outputs='A'
-[2024-08-03 15:13:20] [Rank 3] totoal_tokens=1145, outputs='A'
-[2024-08-03 15:13:20] [Rank 2] totoal_tokens=1085, outputs='A'
-[2024-08-03 15:13:20] [Rank 0] totoal_tokens=1219, outputs='A'
-[2024-08-03 15:13:20] [Rank 1] totoal_tokens=1235, outputs='A'
-[2024-08-03 15:13:20] [Rank 2] totoal_tokens=1099, outputs='A'
-[2024-08-03 15:13:20] [Rank 3] totoal_tokens=1149, outputs='A'
-[2024-08-03 15:13:20] [Rank 0] totoal_tokens=1234, outputs='A'
-ng-image-test.jsonl:   1%|▏         | 10/734 [00:03<02:14,  5.39it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   1%|▏         | 11/734 [00:03<02:04,  5.83it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   2%|▏         | 12/734 [00:03<02:00,  5.99it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   2%|▏         | 13/734 [00:03<01:54,  6.31it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   2%|▏         | 14/734 [00:03<01:49,  6.56it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   2%|▏         | 15/734 [00:03<01:46,  6.75it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   2%|▏         | 16/734 [00:04<01:45,  6.82it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   2%|▏         | 17/734 [00:04<01:44,  6.86it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   2%|▏         | 18/734 [00:04<02:40,  4.45it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   3%|▎         | 19/734 [00:04<02:24,  4.93it/s]Processing InternVL2-2B_r[2024-08-03 15:13:20] [Rank 1] totoal_tokens=1248, outputs='A'
-[2024-08-03 15:13:20] [Rank 3] totoal_tokens=1170, outputs='A'
-[2024-08-03 15:13:20] [Rank 2] totoal_tokens=1120, outputs='A'
-[2024-08-03 15:13:20] [Rank 0] totoal_tokens=1244, outputs='A'
-[2024-08-03 15:13:20] [Rank 1] totoal_tokens=1250, outputs='A'
-[2024-08-03 15:13:20] [Rank 3] totoal_tokens=1209, outputs='A'
-[2024-08-03 15:13:20] [Rank 2] totoal_tokens=1124, outputs='A'
-[2024-08-03 15:13:20] [Rank 0] totoal_tokens=1252, outputs='A'
-[2024-08-03 15:13:20] [Rank 1] totoal_tokens=1252, outputs='A'
-[2024-08-03 15:13:20] [Rank 3] totoal_tokens=1219, outputs='A'
-[2024-08-03 15:13:20] [Rank 2] totoal_tokens=1132, outputs='A'
-[2024-08-03 15:13:20] [Rank 0] totoal_tokens=1270, outputs='A'
-[2024-08-03 15:13:20] [Rank 1] totoal_tokens=1252, outputs='A'
-[2024-08-03 15:13:20] [Rank 3] totoal_tokens=1219, outputs='A'
-[2024-08-03 15:13:21] [Rank 2] totoal_tokens=1149, outputs='A'
-[2024-08-03 15:13:21] [Rank 0] totoal_tokens=1290, outputs='A'
-[2024-08-03 15:13:21] [Rank 1] totoal_tokens=1270, outputs='A'
-[2024-08-03 15:13:21] [Rank 3] totoal_tokens=1219, outputs='A'
-[2024-08-03 15:13:21] [Rank 2] totoal_tokens=1161, outputs='A'
-[2024-08-03 15:13:21] [Rank 0] totoal_tokens=1301, outputs='A'
-[2024-08-03 15:13:21] [Rank 1] totoal_tokens=1271, outputs='A'
-[2024-08-03 15:13:21] [Rank 3] totoal_tokens=1221, outputs='A'
-[2024-08-03 15:13:21] [Rank 2] totoal_tokens=1168, outputs='A'
-[2024-08-03 15:13:21] [Rank 0] totoal_tokens=1322, outputs='A'
-[2024-08-03 15:13:21] [Rank 3] totoal_tokens=1231, outputs='A'
-[2024-08-03 15:13:21] [Rank 1] totoal_tokens=1296, outputs='A'
-[2024-08-03 15:13:21] [Rank 2] totoal_tokens=1174, outputs='A'
-[2024-08-03 15:13:21] [Rank 0] totoal_tokens=1340, outputs='A'
-[2024-08-03 15:13:21] [Rank 1] totoal_tokens=1306, outputs='A'
-[2024-08-03 15:13:21] [Rank 2] totoal_tokens=1193, outputs='A'
-[2024-08-03 15:13:21] [Rank 0] totoal_tokens=1342, outputs='A'
-[2024-08-03 15:13:21] [Rank 1] totoal_tokens=1322, outputs='A'
-[2024-08-03 15:13:21] [Rank 2] totoal_tokens=1206, outputs='A'
-[2024-08-03 15:13:21] [Rank 0] totoal_tokens=1342, outputs='A'
-[2024-08-03 15:13:21] [Rank 1] totoal_tokens=1340, outputs='A'
-[2024-08-03 15:13:21] [Rank 3] totoal_tokens=1233, outputs='A'
-[2024-08-03 15:13:21] [Rank 0] totoal_tokens=1351, outputs='A'
-easoning-image-test.jsonl:   3%|▎         | 20/734 [00:04<02:11,  5.42it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   3%|▎         | 21/734 [00:05<02:03,  5.77it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   3%|▎         | 22/734 [00:05<02:01,  5.86it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   3%|▎         | 23/734 [00:05<01:54,  6.19it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   3%|▎         | 24/734 [00:05<01:53,  6.23it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   3%|▎         | 25/734 [00:05<01:53,  6.27it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   4%|▎         | 26/734 [00:05<01:55,  6.14it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   4%|▎         | 27/734 [00:05<01:51,  6.36it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   4%|▍         | 28/734 [00:06<01:48,  6.49it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   4%|▍         | 29/734 [00:06<01:47,  6.59it/s]Processing InternVL[2024-08-03 15:13:22] [Rank 1] totoal_tokens=1351, outputs='A'
-[2024-08-03 15:13:22] [Rank 2] totoal_tokens=1208, outputs='A'
-[2024-08-03 15:13:22] [Rank 3] totoal_tokens=1270, outputs='A'
-[2024-08-03 15:13:22] [Rank 0] totoal_tokens=1351, outputs='A'
-[2024-08-03 15:13:22] [Rank 1] totoal_tokens=1365, outputs='A'
-[2024-08-03 15:13:22] [Rank 2] totoal_tokens=1209, outputs='A'
-[2024-08-03 15:13:22] [Rank 3] totoal_tokens=1271, outputs='A'
-[2024-08-03 15:13:22] [Rank 0] totoal_tokens=1356, outputs='A'
-[2024-08-03 15:13:22] [Rank 2] totoal_tokens=1209, outputs='A'
-[2024-08-03 15:13:22] [Rank 1] totoal_tokens=1367, outputs='A'
-[2024-08-03 15:13:22] [Rank 3] totoal_tokens=1296, outputs='A'
-[2024-08-03 15:13:22] [Rank 0] totoal_tokens=1372, outputs='A'
-[2024-08-03 15:13:22] [Rank 2] totoal_tokens=1225, outputs='A'
-[2024-08-03 15:13:22] [Rank 1] totoal_tokens=1368, outputs='A'
-[2024-08-03 15:13:22] [Rank 3] totoal_tokens=1322, outputs='A'
-[2024-08-03 15:13:22] [Rank 0] totoal_tokens=1384, outputs='A'
-[2024-08-03 15:13:22] [Rank 2] totoal_tokens=1231, outputs='A'
-[2024-08-03 15:13:22] [Rank 1] totoal_tokens=1369, outputs='A'
-[2024-08-03 15:13:22] [Rank 3] totoal_tokens=1340, outputs='A'
-[2024-08-03 15:13:22] [Rank 0] totoal_tokens=1393, outputs='A'
-[2024-08-03 15:13:22] [Rank 2] totoal_tokens=1252, outputs='A'
-[2024-08-03 15:13:22] [Rank 3] totoal_tokens=1342, outputs='A'
-[2024-08-03 15:13:22] [Rank 1] totoal_tokens=1378, outputs='A'
-[2024-08-03 15:13:22] [Rank 0] totoal_tokens=1395, outputs='A'
-[2024-08-03 15:13:22] [Rank 2] totoal_tokens=1256, outputs='A'
-[2024-08-03 15:13:23] [Rank 3] totoal_tokens=1343, outputs='A'
-[2024-08-03 15:13:23] [Rank 1] totoal_tokens=1391, outputs='A'
-[2024-08-03 15:13:23] [Rank 0] totoal_tokens=1395, outputs='A'
-[2024-08-03 15:13:23] [Rank 2] totoal_tokens=1359, outputs='A'
-[2024-08-03 15:13:23] [Rank 3] totoal_tokens=1347, outputs='A'
-[2024-08-03 15:13:23] [Rank 1] totoal_tokens=1397, outputs='A'
-[2024-08-03 15:13:23] [Rank 0] totoal_tokens=1397, outputs='A'
-[2024-08-03 15:13:23] [Rank 2] totoal_tokens=1366, outputs='A'
-[2024-08-03 15:13:23] [Rank 3] totoal_tokens=1359, outputs='A'
-[2024-08-03 15:13:23] [Rank 1] totoal_tokens=1397, outputs='A'
-[2024-08-03 15:13:23] [Rank 0] totoal_tokens=1400, outputs='A'
-[2024-08-03 15:13:23] [Rank 2] totoal_tokens=1372, outputs='A'
-[2024-08-03 15:13:23] [Rank 3] totoal_tokens=1368, outputs='A'
-[2024-08-03 15:13:23] [Rank 1] totoal_tokens=1416, outputs='A'
-[2024-08-03 15:13:23] [Rank 0] totoal_tokens=1405, outputs='A'
-2-2B_reasoning-image-test.jsonl:   4%|▍         | 30/734 [00:06<01:50,  6.36it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   4%|▍         | 31/734 [00:06<01:51,  6.33it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   4%|▍         | 32/734 [00:06<01:49,  6.39it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   4%|▍         | 33/734 [00:06<01:47,  6.51it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   5%|▍         | 34/734 [00:07<01:46,  6.56it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   5%|▍         | 35/734 [00:07<01:45,  6.60it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   5%|▍         | 36/734 [00:07<01:45,  6.62it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   5%|▌         | 37/734 [00:07<01:54,  6.09it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   5%|▌         | 38/734 [00:07<01:48,  6.40it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   5%|▌         | 39/734 [00:07<01:47,  6.47it/s]Processing In[2024-08-03 15:13:23] [Rank 2] totoal_tokens=1372, outputs='A'
-[2024-08-03 15:13:23] [Rank 3] totoal_tokens=1372, outputs='A'
-[2024-08-03 15:13:23] [Rank 1] totoal_tokens=1419, outputs='A'
-[2024-08-03 15:13:23] [Rank 0] totoal_tokens=1406, outputs='A'
-[2024-08-03 15:13:23] [Rank 2] totoal_tokens=1376, outputs='A'
-[2024-08-03 15:13:23] [Rank 3] totoal_tokens=1405, outputs='A'
-[2024-08-03 15:13:23] [Rank 1] totoal_tokens=1419, outputs='A'
-[2024-08-03 15:13:23] [Rank 2] totoal_tokens=1378, outputs='A'
-[2024-08-03 15:13:23] [Rank 0] totoal_tokens=1416, outputs='A'
-[2024-08-03 15:13:23] [Rank 3] totoal_tokens=1413, outputs='A'
-[2024-08-03 15:13:24] [Rank 2] totoal_tokens=1384, outputs='A'
-[2024-08-03 15:13:24] [Rank 0] totoal_tokens=1416, outputs='A'
-[2024-08-03 15:13:24] [Rank 3] totoal_tokens=1416, outputs='A'
-[2024-08-03 15:13:24] [Rank 2] totoal_tokens=1403, outputs='A'
-[2024-08-03 15:13:24] [Rank 0] totoal_tokens=1422, outputs='A'
-[2024-08-03 15:13:24] [Rank 3] totoal_tokens=1418, outputs='A'
-[2024-08-03 15:13:24] [Rank 2] totoal_tokens=1434, outputs='A'
-[2024-08-03 15:13:24] [Rank 0] totoal_tokens=1434, outputs='A'
-[2024-08-03 15:13:24] [Rank 3] totoal_tokens=1420, outputs='A'
-[2024-08-03 15:13:24] [Rank 1] totoal_tokens=1441, outputs='A'
-[2024-08-03 15:13:24] [Rank 2] totoal_tokens=1482, outputs='A'
-[2024-08-03 15:13:24] [Rank 0] totoal_tokens=1450, outputs='A'
-[2024-08-03 15:13:24] [Rank 3] totoal_tokens=1438, outputs='A'
-[2024-08-03 15:13:24] [Rank 2] totoal_tokens=1483, outputs='A'
-[2024-08-03 15:13:24] [Rank 0] totoal_tokens=1450, outputs='A'
-[2024-08-03 15:13:25] [Rank 2] totoal_tokens=1522, outputs='A'
-[2024-08-03 15:13:25] [Rank 1] totoal_tokens=1445, outputs='A'
-[2024-08-03 15:13:25] [Rank 0] totoal_tokens=1458, outputs='A'
-[2024-08-03 15:13:25] [Rank 2] totoal_tokens=1523, outputs='A'
-[2024-08-03 15:13:25] [Rank 1] totoal_tokens=1461, outputs='A'
-[2024-08-03 15:13:25] [Rank 0] totoal_tokens=1498, outputs='A'
-[2024-08-03 15:13:25] [Rank 2] totoal_tokens=1528, outputs='A'
-[2024-08-03 15:13:25] [Rank 3] totoal_tokens=1441, outputs='A'
-[2024-08-03 15:13:25] [Rank 1] totoal_tokens=1482, outputs='A'
-[2024-08-03 15:13:25] [Rank 0] totoal_tokens=1530, outputs='A'
-ternVL2-2B_reasoning-image-test.jsonl:   5%|▌         | 40/734 [00:08<01:57,  5.92it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   6%|▌         | 41/734 [00:08<01:54,  6.08it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   6%|▌         | 42/734 [00:08<02:00,  5.72it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   6%|▌         | 43/734 [00:08<01:56,  5.94it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   6%|▌         | 44/734 [00:08<01:55,  5.97it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   6%|▌         | 45/734 [00:09<02:49,  4.06it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   6%|▋         | 46/734 [00:09<02:27,  4.65it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   6%|��         | 47/734 [00:09<02:14,  5.11it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   7%|▋         | 48/734 [00:09<02:06,  5.40it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   7%|▋         | 49/734 [00:09<02:01,  5.65it/s]Process[2024-08-03 15:13:25] [Rank 2] totoal_tokens=1576, outputs='A'
-[2024-08-03 15:13:25] [Rank 1] totoal_tokens=1498, outputs='A'
-[2024-08-03 15:13:25] [Rank 0] totoal_tokens=1550, outputs='A'
-[2024-08-03 15:13:25] [Rank 2] totoal_tokens=1693, outputs='A'
-[2024-08-03 15:13:26] [Rank 0] totoal_tokens=1725, outputs='A'
-[2024-08-03 15:13:26] [Rank 1] totoal_tokens=1503, outputs='A'
-[2024-08-03 15:13:26] [Rank 3] totoal_tokens=1445, outputs='A'
-[2024-08-03 15:13:26] [Rank 2] totoal_tokens=1725, outputs='A'
-[2024-08-03 15:13:26] [Rank 0] totoal_tokens=1783, outputs='A'
-[2024-08-03 15:13:26] [Rank 1] totoal_tokens=1528, outputs='A'
-[2024-08-03 15:13:26] [Rank 3] totoal_tokens=1457, outputs='A'
-[2024-08-03 15:13:26] [Rank 2] totoal_tokens=1783, outputs='A'
-[2024-08-03 15:13:26] [Rank 0] totoal_tokens=1783, outputs='A'
-[2024-08-03 15:13:26] [Rank 1] totoal_tokens=1530, outputs='A'
-[2024-08-03 15:13:26] [Rank 3] totoal_tokens=1488, outputs='A'
-[2024-08-03 15:13:26] [Rank 2] totoal_tokens=1919, outputs='A'
-[2024-08-03 15:13:26] [Rank 1] totoal_tokens=1535, outputs='A'
-[2024-08-03 15:13:26] [Rank 0] totoal_tokens=1820, outputs='A'
-[2024-08-03 15:13:26] [Rank 3] totoal_tokens=1505, outputs='A'
-[2024-08-03 15:13:26] [Rank 2] totoal_tokens=2023, outputs='A'
-[2024-08-03 15:13:27] [Rank 1] totoal_tokens=1553, outputs='A'
-[2024-08-03 15:13:27] [Rank 0] totoal_tokens=1833, outputs='A'
-[2024-08-03 15:13:27] [Rank 3] totoal_tokens=1536, outputs='A'
-[2024-08-03 15:13:27] [Rank 2] totoal_tokens=2068, outputs='A'
-[2024-08-03 15:13:27] [Rank 1] totoal_tokens=1668, outputs='A'
-[2024-08-03 15:13:27] [Rank 0] totoal_tokens=2168, outputs='A'
-[2024-08-03 15:13:27] [Rank 3] totoal_tokens=1553, outputs='A'
-[2024-08-03 15:13:27] [Rank 2] totoal_tokens=2221, outputs='A'
-[2024-08-03 15:13:27] [Rank 1] totoal_tokens=1758, outputs='A'
-[2024-08-03 15:13:27] [Rank 0] totoal_tokens=2227, outputs='A'
-[2024-08-03 15:13:27] [Rank 3] totoal_tokens=1575, outputs='A'
-[2024-08-03 15:13:27] [Rank 2] totoal_tokens=2227, outputs='A'
-[2024-08-03 15:13:27] [Rank 3] totoal_tokens=1609, outputs='A'
-[2024-08-03 15:13:27] [Rank 0] totoal_tokens=2239, outputs='A'
-[2024-08-03 15:13:27] [Rank 1] totoal_tokens=1779, outputs='A'
-[2024-08-03 15:13:27] [Rank 2] totoal_tokens=2239, outputs='A'
-[2024-08-03 15:13:27] [Rank 0] totoal_tokens=2248, outputs='A'
-ing InternVL2-2B_reasoning-image-test.jsonl:   7%|▋         | 50/734 [00:10<02:51,  3.99it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   7%|▋         | 51/734 [00:10<02:36,  4.37it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   7%|▋         | 52/734 [00:10<03:21,  3.38it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   7%|▋         | 53/734 [00:10<02:55,  3.88it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   7%|▋         | 54/734 [00:11<02:36,  4.33it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   7%|▋         | 55/734 [00:11<02:25,  4.68it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   8%|▊         | 56/734 [00:11<02:19,  4.85it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   8%|▊         | 57/734 [00:11<02:13,  5.06it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   8%|▊         | 58/734 [00:11<02:09,  5.22it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   8%|▊         | 59/734 [00:12<02:11,  5.12it/s]P[2024-08-03 15:13:27] [Rank 1] totoal_tokens=1783, outputs='A'
-[2024-08-03 15:13:27] [Rank 3] totoal_tokens=1665, outputs='A'
-[2024-08-03 15:13:27] [Rank 2] totoal_tokens=2246, outputs='A'
-[2024-08-03 15:13:27] [Rank 1] totoal_tokens=1830, outputs='A'
-[2024-08-03 15:13:28] [Rank 0] totoal_tokens=2256, outputs='A'
-[2024-08-03 15:13:28] [Rank 3] totoal_tokens=1805, outputs='A'
-[2024-08-03 15:13:28] [Rank 2] totoal_tokens=2256, outputs='A'
-[2024-08-03 15:13:28] [Rank 1] totoal_tokens=1834, outputs='A'
-[2024-08-03 15:13:28] [Rank 0] totoal_tokens=2264, outputs='A'
-[2024-08-03 15:13:28] [Rank 3] totoal_tokens=1834, outputs='A'
-[2024-08-03 15:13:28] [Rank 2] totoal_tokens=2338, outputs='A'
-[2024-08-03 15:13:28] [Rank 1] totoal_tokens=1911, outputs='A'
-[2024-08-03 15:13:28] [Rank 0] totoal_tokens=2292, outputs='A'
-[2024-08-03 15:13:28] [Rank 3] totoal_tokens=1958, outputs='A'
-[2024-08-03 15:13:28] [Rank 1] totoal_tokens=1919, outputs='A'
-[2024-08-03 15:13:28] [Rank 2] totoal_tokens=2367, outputs='A'
-[2024-08-03 15:13:28] [Rank 0] totoal_tokens=2402, outputs='A'
-[2024-08-03 15:13:28] [Rank 3] totoal_tokens=2068, outputs='A'
-[2024-08-03 15:13:28] [Rank 1] totoal_tokens=1944, outputs='A'
-[2024-08-03 15:13:28] [Rank 2] totoal_tokens=2387, outputs='A'
-[2024-08-03 15:13:28] [Rank 3] totoal_tokens=2070, outputs='A'
-[2024-08-03 15:13:28] [Rank 0] totoal_tokens=2405, outputs='A'
-[2024-08-03 15:13:28] [Rank 1] totoal_tokens=1948, outputs='A'
-[2024-08-03 15:13:28] [Rank 2] totoal_tokens=2398, outputs='A'
-[2024-08-03 15:13:28] [Rank 3] totoal_tokens=2273, outputs='A'
-[2024-08-03 15:13:29] [Rank 0] totoal_tokens=2406, outputs='A'
-[2024-08-03 15:13:29] [Rank 1] totoal_tokens=2023, outputs='A'
-[2024-08-03 15:13:29] [Rank 2] totoal_tokens=2401, outputs='A'
-[2024-08-03 15:13:29] [Rank 3] totoal_tokens=2387, outputs='A'
-[2024-08-03 15:13:29] [Rank 1] totoal_tokens=2030, outputs='A'
-[2024-08-03 15:13:29] [Rank 0] totoal_tokens=2413, outputs='A'
-[2024-08-03 15:13:29] [Rank 2] totoal_tokens=2408, outputs='A'
-[2024-08-03 15:13:29] [Rank 3] totoal_tokens=2387, outputs='A'
-[2024-08-03 15:13:29] [Rank 1] totoal_tokens=2055, outputs='A'
-[2024-08-03 15:13:29] [Rank 0] totoal_tokens=2413, outputs='A'
-[2024-08-03 15:13:29] [Rank 2] totoal_tokens=2413, outputs='A'
-[2024-08-03 15:13:29] [Rank 3] totoal_tokens=2400, outputs='A'
-[2024-08-03 15:13:29] [Rank 1] totoal_tokens=2168, outputs='A'
-[2024-08-03 15:13:29] [Rank 0] totoal_tokens=2431, outputs='A'
-rocessing InternVL2-2B_reasoning-image-test.jsonl:   8%|▊         | 60/734 [00:12<02:12,  5.10it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   8%|▊         | 61/734 [00:12<02:14,  5.01it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   8%|▊         | 62/734 [00:12<02:14,  5.00it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   9%|▊         | 63/734 [00:12<02:13,  5.04it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   9%|▊         | 64/734 [00:13<02:12,  5.05it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   9%|▉         | 65/734 [00:13<02:17,  4.85it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   9%|▉         | 66/734 [00:13<02:13,  5.01it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   9%|▉         | 67/734 [00:13<02:16,  4.87it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   9%|▉         | 68/734 [00:13<02:17,  4.85it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:   9%|▉         | 69/734 [00:14<02:16,  4.89i[2024-08-03 15:13:29] [Rank 2] totoal_tokens=2422, outputs='A'
-[2024-08-03 15:13:29] [Rank 3] totoal_tokens=2409, outputs='A'
-[2024-08-03 15:13:29] [Rank 1] totoal_tokens=2175, outputs='A'
-[2024-08-03 15:13:29] [Rank 0] totoal_tokens=2432, outputs='A'
-[2024-08-03 15:13:29] [Rank 2] totoal_tokens=2430, outputs='A'
-[2024-08-03 15:13:29] [Rank 1] totoal_tokens=2223, outputs='A'
-[2024-08-03 15:13:29] [Rank 3] totoal_tokens=2413, outputs='A'
-[2024-08-03 15:13:30] [Rank 0] totoal_tokens=2456, outputs='A'
-[2024-08-03 15:13:30] [Rank 2] totoal_tokens=2439, outputs='A'
-[2024-08-03 15:13:30] [Rank 1] totoal_tokens=2264, outputs='A'
-[2024-08-03 15:13:30] [Rank 3] totoal_tokens=2415, outputs='A'
-[2024-08-03 15:13:30] [Rank 0] totoal_tokens=2456, outputs='A'
-[2024-08-03 15:13:30] [Rank 2] totoal_tokens=2457, outputs='A'
-[2024-08-03 15:13:30] [Rank 1] totoal_tokens=2281, outputs='A'
-[2024-08-03 15:13:30] [Rank 3] totoal_tokens=2419, outputs='A'
-[2024-08-03 15:13:30] [Rank 0] totoal_tokens=2464, outputs='A'
-[2024-08-03 15:13:30] [Rank 1] totoal_tokens=2281, outputs='A'
-[2024-08-03 15:13:30] [Rank 2] totoal_tokens=2464, outputs='A'
-[2024-08-03 15:13:30] [Rank 3] totoal_tokens=2425, outputs='A'
-[2024-08-03 15:13:30] [Rank 0] totoal_tokens=2480, outputs='A'
-[2024-08-03 15:13:30] [Rank 1] totoal_tokens=2291, outputs='A'
-[2024-08-03 15:13:30] [Rank 2] totoal_tokens=2540, outputs='A'
-[2024-08-03 15:13:30] [Rank 3] totoal_tokens=2427, outputs='A'
-[2024-08-03 15:13:30] [Rank 0] totoal_tokens=2480, outputs='A'
-[2024-08-03 15:13:30] [Rank 2] totoal_tokens=2548, outputs='B'
-[2024-08-03 15:13:30] [Rank 1] totoal_tokens=2312, outputs='A'
-[2024-08-03 15:13:31] [Rank 0] totoal_tokens=2506, outputs='A'
-[2024-08-03 15:13:31] [Rank 1] totoal_tokens=2312, outputs='A'
-[2024-08-03 15:13:31] [Rank 2] totoal_tokens=2567, outputs='A'
-[2024-08-03 15:13:31] [Rank 3] totoal_tokens=2430, outputs='A'
-[2024-08-03 15:13:31] [Rank 0] totoal_tokens=2530, outputs='A'
-[2024-08-03 15:13:31] [Rank 1] totoal_tokens=2362, outputs='A'
-[2024-08-03 15:13:31] [Rank 0] totoal_tokens=2580, outputs='B'
-[2024-08-03 15:13:31] [Rank 2] totoal_tokens=2597, outputs='A'
-[2024-08-03 15:13:31] [Rank 1] totoal_tokens=2389, outputs='A'
-[2024-08-03 15:13:31] [Rank 3] totoal_tokens=2453, outputs='A'
-[2024-08-03 15:13:31] [Rank 0] totoal_tokens=2615, outputs='B'
-t/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  10%|▉         | 70/734 [00:14<02:11,  5.06it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  10%|▉         | 71/734 [00:14<02:15,  4.91it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  10%|▉         | 72/734 [00:14<02:18,  4.78it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  10%|▉         | 73/734 [00:14<02:16,  4.84it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  10%|█         | 74/734 [00:15<02:13,  4.93it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  10%|█         | 75/734 [00:15<02:10,  5.05it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  10%|█         | 76/734 [00:15<02:07,  5.18it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  10%|█         | 77/734 [00:15<02:41,  4.08it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  11%|█         | 78/734 [00:15<02:17,  4.76it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  11%|█         | 79/734 [00:16<02:03, [2024-08-03 15:13:31] [Rank 2] totoal_tokens=2616, outputs='A'
-[2024-08-03 15:13:31] [Rank 1] totoal_tokens=2389, outputs='A'
-[2024-08-03 15:13:31] [Rank 0] totoal_tokens=2616, outputs='A'
-[2024-08-03 15:13:31] [Rank 3] totoal_tokens=2456, outputs='A'
-[2024-08-03 15:13:31] [Rank 2] totoal_tokens=2618, outputs='A'
-[2024-08-03 15:13:31] [Rank 1] totoal_tokens=2402, outputs='A'
-[2024-08-03 15:13:31] [Rank 0] totoal_tokens=2636, outputs='B'
-[2024-08-03 15:13:32] [Rank 3] totoal_tokens=2456, outputs='A'
-[2024-08-03 15:13:32] [Rank 2] totoal_tokens=2636, outputs='B'
-[2024-08-03 15:13:32] [Rank 1] totoal_tokens=2402, outputs='A'
-[2024-08-03 15:13:32] [Rank 2] totoal_tokens=2636, outputs='B'
-[2024-08-03 15:13:32] [Rank 0] totoal_tokens=2726, outputs='A'
-[2024-08-03 15:13:32] [Rank 3] totoal_tokens=2459, outputs='A'
-[2024-08-03 15:13:32] [Rank 1] totoal_tokens=2431, outputs='A'
-[2024-08-03 15:13:32] [Rank 2] totoal_tokens=2636, outputs='B'
-[2024-08-03 15:13:32] [Rank 0] totoal_tokens=2728, outputs='B'
-[2024-08-03 15:13:32] [Rank 3] totoal_tokens=2460, outputs='A'
-[2024-08-03 15:13:32] [Rank 0] totoal_tokens=2728, outputs='B'
-[2024-08-03 15:13:32] [Rank 1] totoal_tokens=2597, outputs='A'
-[2024-08-03 15:13:32] [Rank 2] totoal_tokens=2641, outputs='A'
-[2024-08-03 15:13:32] [Rank 0] totoal_tokens=2742, outputs='B'
-[2024-08-03 15:13:32] [Rank 3] totoal_tokens=2480, outputs='A'
-[2024-08-03 15:13:32] [Rank 1] totoal_tokens=2615, outputs='B'
-[2024-08-03 15:13:32] [Rank 2] totoal_tokens=2724, outputs='B'
-[2024-08-03 15:13:32] [Rank 0] totoal_tokens=2744, outputs='B'
-[2024-08-03 15:13:32] [Rank 1] totoal_tokens=2615, outputs='B'
-[2024-08-03 15:13:32] [Rank 3] totoal_tokens=2533, outputs='A'
-[2024-08-03 15:13:32] [Rank 2] totoal_tokens=2728, outputs='B'
-[2024-08-03 15:13:32] [Rank 0] totoal_tokens=2744, outputs='B'
-[2024-08-03 15:13:33] [Rank 2] totoal_tokens=2742, outputs='B'
-[2024-08-03 15:13:33] [Rank 1] totoal_tokens=2616, outputs='A'
-[2024-08-03 15:13:33] [Rank 0] totoal_tokens=2746, outputs='B'
-[2024-08-03 15:13:33] [Rank 3] totoal_tokens=2540, outputs='A'
-[2024-08-03 15:13:33] [Rank 2] totoal_tokens=2759, outputs='B'
-[2024-08-03 15:13:33] [Rank 1] totoal_tokens=2636, outputs='B'
-[2024-08-03 15:13:33] [Rank 0] totoal_tokens=2746, outputs='B'
- 5.31it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  11%|█         | 80/734 [00:16<02:08,  5.07it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  11%|█         | 81/734 [00:16<01:54,  5.71it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  11%|█         | 82/734 [00:16<02:12,  4.92it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  11%|█▏        | 83/734 [00:16<01:57,  5.52it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  11%|█▏        | 84/734 [00:17<02:03,  5.24it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  12%|█▏        | 85/734 [00:17<01:51,  5.83it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  12%|█▏        | 86/734 [00:17<01:44,  6.20it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  12%|█▏        | 87/734 [00:17<01:37,  6.64it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  12%|█▏        | 88/734 [00:17<01:33,  6.87it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  12%|█▏        | 8[2024-08-03 15:13:33] [Rank 3] totoal_tokens=2548, outputs='B'
-[2024-08-03 15:13:33] [Rank 2] totoal_tokens=2759, outputs='B'
-[2024-08-03 15:13:33] [Rank 0] totoal_tokens=2772, outputs='B'
-[2024-08-03 15:13:33] [Rank 3] totoal_tokens=2580, outputs='B'
-[2024-08-03 15:13:33] [Rank 1] totoal_tokens=2651, outputs='A'
-[2024-08-03 15:13:33] [Rank 2] totoal_tokens=2776, outputs='A'
-[2024-08-03 15:13:34] [Rank 3] totoal_tokens=2581, outputs='A'
-[2024-08-03 15:13:34] [Rank 0] totoal_tokens=2827, outputs='A'
-[2024-08-03 15:13:34] [Rank 2] totoal_tokens=2803, outputs='B'
-[2024-08-03 15:13:34] [Rank 3] totoal_tokens=2615, outputs='B'
-[2024-08-03 15:13:34] [Rank 1] totoal_tokens=2651, outputs='A'
-[2024-08-03 15:13:34] [Rank 2] totoal_tokens=2803, outputs='B'
-[2024-08-03 15:13:34] [Rank 3] totoal_tokens=2615, outputs='B'
-[2024-08-03 15:13:34] [Rank 0] totoal_tokens=2828, outputs='A'
-[2024-08-03 15:13:34] [Rank 1] totoal_tokens=2719, outputs='B'
-[2024-08-03 15:13:34] [Rank 3] totoal_tokens=2615, outputs='B'
-[2024-08-03 15:13:34] [Rank 2] totoal_tokens=2833, outputs='A'
-[2024-08-03 15:13:34] [Rank 1] totoal_tokens=2724, outputs='B'
-[2024-08-03 15:13:34] [Rank 0] totoal_tokens=2828, outputs='A'
-[2024-08-03 15:13:34] [Rank 3] totoal_tokens=2626, outputs='A'
-[2024-08-03 15:13:34] [Rank 2] totoal_tokens=2838, outputs='B'
-[2024-08-03 15:13:34] [Rank 1] totoal_tokens=2742, outputs='B'
-[2024-08-03 15:13:34] [Rank 0] totoal_tokens=2853, outputs='A'
-[2024-08-03 15:13:35] [Rank 1] totoal_tokens=2742, outputs='B'
-[2024-08-03 15:13:35] [Rank 2] totoal_tokens=2838, outputs='B'
-[2024-08-03 15:13:35] [Rank 3] totoal_tokens=2698, outputs='A'
-[2024-08-03 15:13:35] [Rank 0] totoal_tokens=2857, outputs='A'
-[2024-08-03 15:13:35] [Rank 1] totoal_tokens=2742, outputs='B'
-[2024-08-03 15:13:35] [Rank 2] totoal_tokens=2838, outputs='B'
-[2024-08-03 15:13:35] [Rank 3] totoal_tokens=2719, outputs='B'
-[2024-08-03 15:13:35] [Rank 0] totoal_tokens=2860, outputs='B'
-[2024-08-03 15:13:35] [Rank 1] totoal_tokens=2744, outputs='B'
-[2024-08-03 15:13:35] [Rank 3] totoal_tokens=2728, outputs='B'
-[2024-08-03 15:13:35] [Rank 0] totoal_tokens=2896, outputs='B'
-[2024-08-03 15:13:35] [Rank 2] totoal_tokens=2896, outputs='A'
-[2024-08-03 15:13:35] [Rank 1] totoal_tokens=2746, outputs='B'
-[2024-08-03 15:13:35] [Rank 3] totoal_tokens=2728, outputs='B'
-[2024-08-03 15:13:35] [Rank 0] totoal_tokens=2898, outputs='B'
-[2024-08-03 15:13:35] [Rank 2] totoal_tokens=2898, outputs='B'
-[2024-08-03 15:13:35] [Rank 1] totoal_tokens=2746, outputs='B'
-[2024-08-03 15:13:35] [Rank 3] totoal_tokens=2744, outputs='B'
-[2024-08-03 15:13:35] [Rank 0] totoal_tokens=2898, outputs='B'
-9/734 [00:17<02:04,  5.17it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  12%|█▏        | 90/734 [00:18<01:52,  5.74it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  12%|█▏        | 91/734 [00:18<02:48,  3.81it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  13%|█▎        | 92/734 [00:18<02:48,  3.82it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  13%|█▎        | 93/734 [00:18<02:48,  3.81it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  13%|█▎        | 94/734 [00:19<02:49,  3.78it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  13%|█▎        | 95/734 [00:19<03:11,  3.33it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  13%|█▎        | 96/734 [00:19<02:38,  4.03it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  13%|█▎        | 97/734 [00:19<02:14,  4.75it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  13%|█▎        | 98/734 [00:20<02:01,  5.23it/s]Processing InternVL2-2B_reasoning-image-test.jso[2024-08-03 15:13:35] [Rank 2] totoal_tokens=2898, outputs='B'
-[2024-08-03 15:13:35] [Rank 1] totoal_tokens=2759, outputs='B'
-[2024-08-03 15:13:35] [Rank 3] totoal_tokens=2746, outputs='B'
-[2024-08-03 15:13:35] [Rank 0] totoal_tokens=2914, outputs='B'
-[2024-08-03 15:13:35] [Rank 2] totoal_tokens=2914, outputs='B'
-[2024-08-03 15:13:35] [Rank 1] totoal_tokens=2759, outputs='B'
-[2024-08-03 15:13:35] [Rank 3] totoal_tokens=2746, outputs='B'
-[2024-08-03 15:13:36] [Rank 0] totoal_tokens=2927, outputs='B'
-[2024-08-03 15:13:36] [Rank 2] totoal_tokens=2934, outputs='B'
-[2024-08-03 15:13:36] [Rank 3] totoal_tokens=2759, outputs='B'
-[2024-08-03 15:13:36] [Rank 0] totoal_tokens=2946, outputs='B'
-[2024-08-03 15:13:36] [Rank 1] totoal_tokens=2792, outputs='A'
-[2024-08-03 15:13:36] [Rank 2] totoal_tokens=2934, outputs='B'
-[2024-08-03 15:13:36] [Rank 3] totoal_tokens=2838, outputs='B'
-[2024-08-03 15:13:36] [Rank 0] totoal_tokens=2984, outputs='B'
-[2024-08-03 15:13:36] [Rank 2] totoal_tokens=2934, outputs='B'
-[2024-08-03 15:13:36] [Rank 1] totoal_tokens=2801, outputs='A'
-[2024-08-03 15:13:36] [Rank 3] totoal_tokens=2838, outputs='B'
-[2024-08-03 15:13:36] [Rank 0] totoal_tokens=2984, outputs='B'
-[2024-08-03 15:13:36] [Rank 2] totoal_tokens=2946, outputs='B'
-[2024-08-03 15:13:36] [Rank 1] totoal_tokens=2838, outputs='B'
-[2024-08-03 15:13:36] [Rank 0] totoal_tokens=2986, outputs='B'
-[2024-08-03 15:13:36] [Rank 2] totoal_tokens=2946, outputs='B'
-[2024-08-03 15:13:36] [Rank 3] totoal_tokens=2867, outputs='A'
-[2024-08-03 15:13:36] [Rank 1] totoal_tokens=2838, outputs='B'
-[2024-08-03 15:13:36] [Rank 0] totoal_tokens=2986, outputs='B'
-[2024-08-03 15:13:36] [Rank 3] totoal_tokens=2896, outputs='B'
-[2024-08-03 15:13:36] [Rank 2] totoal_tokens=2980, outputs='A'
-[2024-08-03 15:13:37] [Rank 0] totoal_tokens=2987, outputs='B'
-[2024-08-03 15:13:37] [Rank 1] totoal_tokens=2842, outputs='A'
-[2024-08-03 15:13:37] [Rank 3] totoal_tokens=2896, outputs='B'
-[2024-08-03 15:13:37] [Rank 1] totoal_tokens=2860, outputs='B'
-[2024-08-03 15:13:37] [Rank 2] totoal_tokens=2986, outputs='B'
-[2024-08-03 15:13:37] [Rank 0] totoal_tokens=2996, outputs='A'
-[2024-08-03 15:13:37] [Rank 3] totoal_tokens=2897, outputs='A'
-[2024-08-03 15:13:37] [Rank 1] totoal_tokens=2877, outputs='B'
-[2024-08-03 15:13:37] [Rank 2] totoal_tokens=2988, outputs='B'
-[2024-08-03 15:13:37] [Rank 0] totoal_tokens=2997, outputs='B'
-nl:  13%|█▎        | 99/734 [00:20<01:50,  5.74it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  14%|█▎        | 100/734 [00:20<01:42,  6.20it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  14%|█▍        | 101/734 [00:20<01:35,  6.62it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  14%|█▍        | 102/734 [00:20<01:31,  6.93it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  14%|█▍        | 103/734 [00:20<01:32,  6.85it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  14%|█▍        | 104/734 [00:20<01:29,  7.04it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  14%|█▍        | 105/734 [00:20<01:29,  7.06it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  14%|█▍        | 106/734 [00:21<02:01,  5.15it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  15%|█▍        | 107/734 [00:21<01:49,  5.71it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  15%|█▍        | 108/734 [00:21<02:27,  4.24it/s]Processing In[2024-08-03 15:13:37] [Rank 1] totoal_tokens=2898, outputs='B'
-[2024-08-03 15:13:37] [Rank 0] totoal_tokens=2997, outputs='B'
-[2024-08-03 15:13:37] [Rank 3] totoal_tokens=2908, outputs='A'
-[2024-08-03 15:13:37] [Rank 2] totoal_tokens=2996, outputs='A'
-[2024-08-03 15:13:37] [Rank 3] totoal_tokens=2934, outputs='B'
-[2024-08-03 15:13:37] [Rank 1] totoal_tokens=2905, outputs='A'
-[2024-08-03 15:13:37] [Rank 2] totoal_tokens=2997, outputs='B'
-[2024-08-03 15:13:37] [Rank 0] totoal_tokens=3004, outputs='A'
-[2024-08-03 15:13:38] [Rank 2] totoal_tokens=2999, outputs='B'
-[2024-08-03 15:13:38] [Rank 0] totoal_tokens=3009, outputs='B'
-[2024-08-03 15:13:38] [Rank 3] totoal_tokens=2956, outputs='A'
-[2024-08-03 15:13:38] [Rank 1] totoal_tokens=2934, outputs='B'
-[2024-08-03 15:13:38] [Rank 2] totoal_tokens=3009, outputs='B'
-[2024-08-03 15:13:38] [Rank 3] totoal_tokens=2986, outputs='B'
-[2024-08-03 15:13:38] [Rank 1] totoal_tokens=2946, outputs='B'
-[2024-08-03 15:13:38] [Rank 0] totoal_tokens=3017, outputs='A'
-[2024-08-03 15:13:38] [Rank 2] totoal_tokens=3009, outputs='B'
-[2024-08-03 15:13:38] [Rank 3] totoal_tokens=2987, outputs='B'
-[2024-08-03 15:13:38] [Rank 1] totoal_tokens=2948, outputs='B'
-[2024-08-03 15:13:38] [Rank 3] totoal_tokens=2987, outputs='B'
-[2024-08-03 15:13:38] [Rank 2] totoal_tokens=3021, outputs='A'
-[2024-08-03 15:13:38] [Rank 0] totoal_tokens=3026, outputs='A'
-[2024-08-03 15:13:38] [Rank 1] totoal_tokens=2955, outputs='A'
-[2024-08-03 15:13:38] [Rank 3] totoal_tokens=2987, outputs='B'
-[2024-08-03 15:13:39] [Rank 0] totoal_tokens=3026, outputs='B'
-[2024-08-03 15:13:39] [Rank 2] totoal_tokens=3026, outputs='A'
-[2024-08-03 15:13:39] [Rank 1] totoal_tokens=2974, outputs='A'
-[2024-08-03 15:13:39] [Rank 0] totoal_tokens=3045, outputs='B'
-[2024-08-03 15:13:39] [Rank 3] totoal_tokens=3013, outputs='A'
-[2024-08-03 15:13:39] [Rank 1] totoal_tokens=2997, outputs='B'
-[2024-08-03 15:13:39] [Rank 2] totoal_tokens=3029, outputs='A'
-[2024-08-03 15:13:39] [Rank 0] totoal_tokens=3048, outputs='B'
-[2024-08-03 15:13:39] [Rank 3] totoal_tokens=3013, outputs='A'
-[2024-08-03 15:13:39] [Rank 1] totoal_tokens=2997, outputs='B'
-[2024-08-03 15:13:39] [Rank 2] totoal_tokens=3048, outputs='B'
-[2024-08-03 15:13:39] [Rank 0] totoal_tokens=3048, outputs='B'
-ternVL2-2B_reasoning-image-test.jsonl:  15%|█▍        | 109/734 [00:21<02:09,  4.82it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  15%|█▍        | 110/734 [00:22<02:16,  4.58it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  15%|█▌        | 111/734 [00:22<02:16,  4.57it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  15%|█▌        | 112/734 [00:22<02:01,  5.13it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  15%|█▌        | 113/734 [00:23<03:00,  3.44it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  16%|█▌        | 114/734 [00:23<02:48,  3.68it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  16%|█▌        | 115/734 [00:23<02:26,  4.23it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  16%|█▌        | 116/734 [00:23<02:07,  4.87it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  16%|█▌        | 117/734 [00:23<01:56,  5.28it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  16%|█▌        | 118/734 [0[2024-08-03 15:13:39] [Rank 3] totoal_tokens=3026, outputs='B'
-[2024-08-03 15:13:39] [Rank 1] totoal_tokens=2999, outputs='B'
-[2024-08-03 15:13:39] [Rank 2] totoal_tokens=3055, outputs='B'
-[2024-08-03 15:13:39] [Rank 0] totoal_tokens=3048, outputs='B'
-[2024-08-03 15:13:39] [Rank 1] totoal_tokens=3009, outputs='B'
-[2024-08-03 15:13:39] [Rank 3] totoal_tokens=3026, outputs='B'
-[2024-08-03 15:13:39] [Rank 2] totoal_tokens=3059, outputs='B'
-[2024-08-03 15:13:39] [Rank 3] totoal_tokens=3045, outputs='B'
-[2024-08-03 15:13:39] [Rank 0] totoal_tokens=3066, outputs='A'
-[2024-08-03 15:13:39] [Rank 2] totoal_tokens=3110, outputs='B'
-[2024-08-03 15:13:39] [Rank 1] totoal_tokens=3013, outputs='A'
-[2024-08-03 15:13:39] [Rank 3] totoal_tokens=3048, outputs='B'
-[2024-08-03 15:13:40] [Rank 0] totoal_tokens=3078, outputs='A'
-[2024-08-03 15:13:40] [Rank 3] totoal_tokens=3048, outputs='B'
-[2024-08-03 15:13:40] [Rank 1] totoal_tokens=3022, outputs='A'
-[2024-08-03 15:13:40] [Rank 3] totoal_tokens=3048, outputs='B'
-[2024-08-03 15:13:40] [Rank 1] totoal_tokens=3045, outputs='B'
-[2024-08-03 15:13:40] [Rank 3] totoal_tokens=3049, outputs='B'
-[2024-08-03 15:13:40] [Rank 2] totoal_tokens=3132, outputs='B'
-[2024-08-03 15:13:40] [Rank 1] totoal_tokens=3051, outputs='A'
-[2024-08-03 15:13:40] [Rank 3] totoal_tokens=3055, outputs='B'
-[2024-08-03 15:13:40] [Rank 2] totoal_tokens=3173, outputs='B'
-[2024-08-03 15:13:40] [Rank 0] totoal_tokens=3132, outputs='B'
-[2024-08-03 15:13:40] [Rank 1] totoal_tokens=3059, outputs='B'
-[2024-08-03 15:13:40] [Rank 2] totoal_tokens=3250, outputs='B'
-[2024-08-03 15:13:40] [Rank 3] totoal_tokens=3066, outputs='A'
-[2024-08-03 15:13:40] [Rank 0] totoal_tokens=3173, outputs='B'
-[2024-08-03 15:13:40] [Rank 1] totoal_tokens=3066, outputs='A'
-[2024-08-03 15:13:40] [Rank 2] totoal_tokens=3266, outputs='B'
-[2024-08-03 15:13:40] [Rank 0] totoal_tokens=3175, outputs='B'
-[2024-08-03 15:13:40] [Rank 1] totoal_tokens=3120, outputs='B'
-[2024-08-03 15:13:40] [Rank 3] totoal_tokens=3066, outputs='A'
-[2024-08-03 15:13:41] [Rank 2] totoal_tokens=3400, outputs='A'
-[2024-08-03 15:13:41] [Rank 1] totoal_tokens=3175, outputs='B'
-[2024-08-03 15:13:41] [Rank 0] totoal_tokens=3189, outputs='A'
-[2024-08-03 15:13:41] [Rank 3] totoal_tokens=3071, outputs='A'
-[2024-08-03 15:13:41] [Rank 2] totoal_tokens=3406, outputs='A'
-[2024-08-03 15:13:41] [Rank 1] totoal_tokens=3182, outputs='A'
-[2024-08-03 15:13:41] [Rank 0] totoal_tokens=3220, outputs='A'
-[2024-08-03 15:13:41] [Rank 3] totoal_tokens=3118, outputs='A'
-[2024-08-03 15:13:41] [Rank 2] totoal_tokens=3415, outputs='A'
-[2024-08-03 15:13:41] [Rank 1] totoal_tokens=3189, outputs='A'
-[2024-08-03 15:13:41] [Rank 3] totoal_tokens=3143, outputs='A'
-[2024-08-03 15:13:41] [Rank 0] totoal_tokens=3314, outputs='A'
-[2024-08-03 15:13:41] [Rank 3] totoal_tokens=3187, outputs='B'
-[2024-08-03 15:13:41] [Rank 2] totoal_tokens=3520, outputs='A'
-[2024-08-03 15:13:41] [Rank 1] totoal_tokens=3414, outputs='A'
-[2024-08-03 15:13:41] [Rank 2] totoal_tokens=3530, outputs='A'
-[2024-08-03 15:13:42] [Rank 0] totoal_tokens=3401, outputs='A'
-0:23<01:45,  5.83it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  16%|█▌        | 119/734 [00:24<01:40,  6.13it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  16%|█▋        | 120/734 [00:24<01:51,  5.51it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  16%|█▋        | 121/734 [00:24<01:57,  5.21it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  17%|█▋        | 122/734 [00:24<02:59,  3.40it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  17%|█▋        | 123/734 [00:25<02:33,  3.98it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  17%|█▋        | 124/734 [00:25<02:18,  4.41it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  17%|█▋        | 125/734 [00:25<02:18,  4.39it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  17%|█▋        | 126/734 [00:25<02:16,  4.46it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  17%|█▋        | 127/734 [00:26<02:45,  3.66it/s]Processing InternVL2-2B_reasoning-image-test.js[2024-08-03 15:13:42] [Rank 1] totoal_tokens=3485, outputs='A'
-[2024-08-03 15:13:42] [Rank 3] totoal_tokens=3282, outputs='B'
-[2024-08-03 15:13:42] [Rank 2] totoal_tokens=3726, outputs='B'
-[2024-08-03 15:13:42] [Rank 1] totoal_tokens=3557, outputs='B'
-[2024-08-03 15:13:42] [Rank 0] totoal_tokens=3418, outputs='A'
-[2024-08-03 15:13:42] [Rank 3] totoal_tokens=3415, outputs='A'
-[2024-08-03 15:13:42] [Rank 1] totoal_tokens=3583, outputs='B'
-[2024-08-03 15:13:42] [Rank 2] totoal_tokens=3733, outputs='A'
-[2024-08-03 15:13:42] [Rank 0] totoal_tokens=3422, outputs='A'
-[2024-08-03 15:13:42] [Rank 3] totoal_tokens=3418, outputs='B'
-[2024-08-03 15:13:42] [Rank 1] totoal_tokens=3593, outputs='A'
-[2024-08-03 15:13:42] [Rank 2] totoal_tokens=3767, outputs='A'
-[2024-08-03 15:13:42] [Rank 0] totoal_tokens=3465, outputs='A'
-[2024-08-03 15:13:42] [Rank 1] totoal_tokens=3693, outputs='B'
-[2024-08-03 15:13:42] [Rank 3] totoal_tokens=3507, outputs='A'
-[2024-08-03 15:13:42] [Rank 2] totoal_tokens=3792, outputs='A'
-[2024-08-03 15:13:42] [Rank 0] totoal_tokens=3611, outputs='A'
-[2024-08-03 15:13:43] [Rank 3] totoal_tokens=3535, outputs='A'
-[2024-08-03 15:13:43] [Rank 1] totoal_tokens=3834, outputs='A'
-[2024-08-03 15:13:43] [Rank 2] totoal_tokens=3865, outputs='A'
-[2024-08-03 15:13:43] [Rank 0] totoal_tokens=3618, outputs='A'
-[2024-08-03 15:13:43] [Rank 3] totoal_tokens=3560, outputs='A'
-[2024-08-03 15:13:43] [Rank 1] totoal_tokens=3883, outputs='A'
-[2024-08-03 15:13:43] [Rank 0] totoal_tokens=3658, outputs='A'
-[2024-08-03 15:13:43] [Rank 2] totoal_tokens=3914, outputs='A'
-[2024-08-03 15:13:43] [Rank 1] totoal_tokens=4017, outputs='B'
-[2024-08-03 15:13:43] [Rank 3] totoal_tokens=3644, outputs='A'
-[2024-08-03 15:13:43] [Rank 1] totoal_tokens=4056, outputs='B'
-[2024-08-03 15:13:43] [Rank 2] totoal_tokens=4005, outputs='B'
-[2024-08-03 15:13:43] [Rank 3] totoal_tokens=3808, outputs='B'
-[2024-08-03 15:13:43] [Rank 0] totoal_tokens=3670, outputs='A'
-[2024-08-03 15:13:44] [Rank 1] totoal_tokens=4165, outputs='B'
-[2024-08-03 15:13:44] [Rank 0] totoal_tokens=3689, outputs='B'
-[2024-08-03 15:13:44] [Rank 2] totoal_tokens=4093, outputs='A'
-[2024-08-03 15:13:44] [Rank 3] totoal_tokens=3821, outputs='A'
-[2024-08-03 15:13:44] [Rank 1] totoal_tokens=4167, outputs='B'
-[2024-08-03 15:13:44] [Rank 0] totoal_tokens=3697, outputs='B'
-[2024-08-03 15:13:44] [Rank 3] totoal_tokens=3887, outputs='A'
-[2024-08-03 15:13:44] [Rank 2] totoal_tokens=4147, outputs='A'
-[2024-08-03 15:13:44] [Rank 0] totoal_tokens=3804, outputs='A'
-onl:  17%|█▋        | 128/734 [00:26<02:53,  3.48it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  18%|█▊        | 129/734 [00:26<02:43,  3.70it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  18%|█▊        | 130/734 [00:26<02:39,  3.80it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  18%|█▊        | 131/734 [00:27<02:32,  3.95it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  18%|█▊        | 132/734 [00:27<02:30,  4.01it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  18%|█▊        | 133/734 [00:27<02:29,  4.02it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  18%|█▊        | 134/734 [00:27<02:33,  3.90it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  18%|█▊        | 135/734 [00:28<03:18,  3.02it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  19%|█▊        | 136/734 [00:28<02:48,  3.54it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  19%|█▊        | 137/734 [00:28<02:26,  4.07it/s]Processing [2024-08-03 15:13:44] [Rank 1] totoal_tokens=4204, outputs='A'
-[2024-08-03 15:13:44] [Rank 2] totoal_tokens=4195, outputs='A'
-[2024-08-03 15:13:44] [Rank 3] totoal_tokens=3890, outputs='A'
-[2024-08-03 15:13:44] [Rank 0] totoal_tokens=3865, outputs='A'
-[2024-08-03 15:13:44] [Rank 1] totoal_tokens=4220, outputs='A'
-[2024-08-03 15:13:44] [Rank 2] totoal_tokens=4203, outputs='B'
-[2024-08-03 15:13:45] [Rank 3] totoal_tokens=3914, outputs='A'
-[2024-08-03 15:13:45] [Rank 0] totoal_tokens=3921, outputs='A'
-[2024-08-03 15:13:45] [Rank 1] totoal_tokens=4231, outputs='B'
-[2024-08-03 15:13:45] [Rank 2] totoal_tokens=4234, outputs='B'
-[2024-08-03 15:13:45] [Rank 3] totoal_tokens=3940, outputs='A'
-[2024-08-03 15:13:45] [Rank 2] totoal_tokens=4262, outputs='B'
-[2024-08-03 15:13:45] [Rank 0] totoal_tokens=3921, outputs='A'
-[2024-08-03 15:13:45] [Rank 1] totoal_tokens=4276, outputs='A'
-[2024-08-03 15:13:45] [Rank 3] totoal_tokens=3946, outputs='B'
-[2024-08-03 15:13:45] [Rank 2] totoal_tokens=4266, outputs='B'
-[2024-08-03 15:13:45] [Rank 0] totoal_tokens=3987, outputs='B'
-[2024-08-03 15:13:45] [Rank 0] totoal_tokens=3999, outputs='B'
-[2024-08-03 15:13:45] [Rank 1] totoal_tokens=4329, outputs='A'
-[2024-08-03 15:13:45] [Rank 3] totoal_tokens=4023, outputs='A'
-[2024-08-03 15:13:45] [Rank 0] totoal_tokens=4129, outputs='B'
-[2024-08-03 15:13:45] [Rank 2] totoal_tokens=4276, outputs='A'
-[2024-08-03 15:13:45] [Rank 1] totoal_tokens=4334, outputs='B'
-[2024-08-03 15:13:46] [Rank 3] totoal_tokens=4227, outputs='A'
-[2024-08-03 15:13:46] [Rank 1] totoal_tokens=4349, outputs='B'
-[2024-08-03 15:13:46] [Rank 0] totoal_tokens=4133, outputs='B'
-[2024-08-03 15:13:46] [Rank 2] totoal_tokens=4277, outputs='A'
-[2024-08-03 15:13:46] [Rank 0] totoal_tokens=4149, outputs='A'
-[2024-08-03 15:13:46] [Rank 1] totoal_tokens=4434, outputs='A'
-[2024-08-03 15:13:46] [Rank 3] totoal_tokens=4229, outputs='A'
-[2024-08-03 15:13:46] [Rank 2] totoal_tokens=4279, outputs='A'
-[2024-08-03 15:13:46] [Rank 0] totoal_tokens=4197, outputs='B'
-InternVL2-2B_reasoning-image-test.jsonl:  19%|█▉        | 138/734 [00:29<02:26,  4.06it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  19%|█▉        | 139/734 [00:29<02:27,  4.02it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  19%|█▉        | 140/734 [00:29<02:35,  3.83it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  19%|█▉        | 141/734 [00:29<02:34,  3.84it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  19%|█▉        | 142/734 [00:29<02:18,  4.26it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  19%|█▉        | 143/734 [00:30<02:08,  4.59it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  20%|█▉        | 144/734 [00:30<01:59,  4.95it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  20%|█▉        | 145/734 [00:30<02:06,  4.66it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  20%|█▉        | 146/734 [00:31<03:06,  3.15it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  20%|██        | 147/734 [2024-08-03 15:13:46] [Rank 3] totoal_tokens=4237, outputs='A'
-[2024-08-03 15:13:47] [Rank 2] totoal_tokens=4379, outputs='A'
-[2024-08-03 15:13:47] [Rank 1] totoal_tokens=4445, outputs='A'
-[2024-08-03 15:13:47] [Rank 3] totoal_tokens=4237, outputs='A'
-[2024-08-03 15:13:47] [Rank 2] totoal_tokens=4386, outputs='A'
-[2024-08-03 15:13:47] [Rank 0] totoal_tokens=4208, outputs='B'
-[2024-08-03 15:13:47] [Rank 1] totoal_tokens=4455, outputs='A'
-[2024-08-03 15:13:47] [Rank 3] totoal_tokens=4262, outputs='B'
-[2024-08-03 15:13:47] [Rank 0] totoal_tokens=4262, outputs='B'
-[2024-08-03 15:13:47] [Rank 2] totoal_tokens=4473, outputs='A'
-[2024-08-03 15:13:47] [Rank 1] totoal_tokens=4464, outputs='A'
-[2024-08-03 15:13:47] [Rank 0] totoal_tokens=4296, outputs='B'
-[2024-08-03 15:13:47] [Rank 3] totoal_tokens=4275, outputs='A'
-[2024-08-03 15:13:47] [Rank 0] totoal_tokens=4298, outputs='B'
-[2024-08-03 15:13:47] [Rank 2] totoal_tokens=4554, outputs='A'
-[2024-08-03 15:13:48] [Rank 3] totoal_tokens=4334, outputs='B'
-[2024-08-03 15:13:48] [Rank 1] totoal_tokens=4473, outputs='A'
-[2024-08-03 15:13:48] [Rank 0] totoal_tokens=4396, outputs='B'
-[2024-08-03 15:13:48] [Rank 2] totoal_tokens=4577, outputs='A'
-[2024-08-03 15:13:48] [Rank 1] totoal_tokens=4620, outputs='B'
-[2024-08-03 15:13:48] [Rank 3] totoal_tokens=4522, outputs='A'
-[2024-08-03 15:13:48] [Rank 0] totoal_tokens=4418, outputs='A'
-[2024-08-03 15:13:48] [Rank 1] totoal_tokens=4635, outputs='B'
-[2024-08-03 15:13:48] [Rank 3] totoal_tokens=4674, outputs='B'
-[2024-08-03 15:13:48] [Rank 2] totoal_tokens=4595, outputs='A'
-[2024-08-03 15:13:48] [Rank 1] totoal_tokens=4717, outputs='B'
-[2024-08-03 15:13:48] [Rank 2] totoal_tokens=4635, outputs='B'
-[2024-08-03 15:13:48] [Rank 0] totoal_tokens=4473, outputs='A'
-[2024-08-03 15:13:48] [Rank 3] totoal_tokens=4679, outputs='A'
-[2024-08-03 15:13:48] [Rank 1] totoal_tokens=4733, outputs='B'
-[2024-08-03 15:13:48] [Rank 2] totoal_tokens=4635, outputs='B'
-[2024-08-03 15:13:49] [Rank 3] totoal_tokens=4727, outputs='B'
-[2024-08-03 15:13:49] [Rank 1] totoal_tokens=4734, outputs='B'
-[2024-08-03 15:13:49] [Rank 0] totoal_tokens=4482, outputs='A'
-[2024-08-03 15:13:49] [Rank 2] totoal_tokens=4635, outputs='B'
-[2024-08-03 15:13:49] [Rank 3] totoal_tokens=4767, outputs='B'
-[2024-08-03 15:13:49] [Rank 1] totoal_tokens=4791, outputs='B'
-[2024-08-03 15:13:49] [Rank 2] totoal_tokens=4782, outputs='B'
-[2024-08-03 15:13:49] [Rank 0] totoal_tokens=4606, outputs='B'
-[2024-08-03 15:13:49] [Rank 3] totoal_tokens=4827, outputs='A'
-[2024-08-03 15:13:49] [Rank 2] totoal_tokens=4791, outputs='B'
-[2024-08-03 15:13:49] [Rank 0] totoal_tokens=4635, outputs='B'
-[00:31<02:50,  3.44it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  20%|██        | 148/734 [00:31<03:08,  3.10it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  20%|██        | 149/734 [00:31<02:50,  3.43it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  20%|██        | 150/734 [00:32<02:33,  3.80it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  21%|██        | 151/734 [00:32<02:19,  4.18it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  21%|██        | 152/734 [00:32<02:13,  4.36it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  21%|██        | 153/734 [00:32<02:25,  4.00it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  21%|██        | 154/734 [00:33<02:43,  3.56it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  21%|██        | 155/734 [00:33<02:56,  3.27it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  21%|██▏       | 156/734 [00:33<02:44,  3.51it/s]Processing InternVL2-2B_reasoning-image-tes[2024-08-03 15:13:49] [Rank 1] totoal_tokens=4867, outputs='A'
-[2024-08-03 15:13:49] [Rank 3] totoal_tokens=4844, outputs='B'
-[2024-08-03 15:13:49] [Rank 2] totoal_tokens=4798, outputs='A'
-[2024-08-03 15:13:49] [Rank 1] totoal_tokens=4869, outputs='A'
-[2024-08-03 15:13:50] [Rank 3] totoal_tokens=4919, outputs='A'
-[2024-08-03 15:13:50] [Rank 2] totoal_tokens=4857, outputs='B'
-[2024-08-03 15:13:50] [Rank 1] totoal_tokens=4872, outputs='A'
-[2024-08-03 15:13:50] [Rank 3] totoal_tokens=5100, outputs='B'
-[2024-08-03 15:13:50] [Rank 1] totoal_tokens=4880, outputs='B'
-[2024-08-03 15:13:50] [Rank 0] totoal_tokens=4659, outputs='A'
-[2024-08-03 15:13:50] [Rank 2] totoal_tokens=4867, outputs='A'
-[2024-08-03 15:13:50] [Rank 3] totoal_tokens=5117, outputs='B'
-[2024-08-03 15:13:50] [Rank 1] totoal_tokens=4896, outputs='B'
-[2024-08-03 15:13:50] [Rank 0] totoal_tokens=4826, outputs='B'
-[2024-08-03 15:13:50] [Rank 2] totoal_tokens=4932, outputs='A'
-[2024-08-03 15:13:50] [Rank 3] totoal_tokens=5139, outputs='B'
-[2024-08-03 15:13:50] [Rank 0] totoal_tokens=4855, outputs='A'
-[2024-08-03 15:13:50] [Rank 2] totoal_tokens=4960, outputs='B'
-[2024-08-03 15:13:50] [Rank 1] totoal_tokens=4919, outputs='A'
-[2024-08-03 15:13:51] [Rank 3] totoal_tokens=5142, outputs='B'
-[2024-08-03 15:13:51] [Rank 0] totoal_tokens=4857, outputs='B'
-[2024-08-03 15:13:51] [Rank 2] totoal_tokens=4986, outputs='A'
-[2024-08-03 15:13:51] [Rank 3] totoal_tokens=5144, outputs='B'
-[2024-08-03 15:13:51] [Rank 1] totoal_tokens=5060, outputs='A'
-[2024-08-03 15:13:51] [Rank 0] totoal_tokens=4913, outputs='A'
-[2024-08-03 15:13:51] [Rank 3] totoal_tokens=5196, outputs='B'
-[2024-08-03 15:13:51] [Rank 0] totoal_tokens=4956, outputs='B'
-[2024-08-03 15:13:51] [Rank 2] totoal_tokens=5084, outputs='A'
-[2024-08-03 15:13:51] [Rank 1] totoal_tokens=5076, outputs='A'
-[2024-08-03 15:13:51] [Rank 3] totoal_tokens=5239, outputs='B'
-[2024-08-03 15:13:52] [Rank 2] totoal_tokens=5143, outputs='B'
-[2024-08-03 15:13:52] [Rank 0] totoal_tokens=4956, outputs='A'
-[2024-08-03 15:13:52] [Rank 1] totoal_tokens=5101, outputs='A'
-[2024-08-03 15:13:52] [Rank 3] totoal_tokens=5239, outputs='B'
-[2024-08-03 15:13:52] [Rank 0] totoal_tokens=5031, outputs='B'
-[2024-08-03 15:13:52] [Rank 2] totoal_tokens=5191, outputs='B'
-[2024-08-03 15:13:52] [Rank 1] totoal_tokens=5129, outputs='A'
-[2024-08-03 15:13:52] [Rank 3] totoal_tokens=5262, outputs='A'
-[2024-08-03 15:13:52] [Rank 2] totoal_tokens=5200, outputs='B'
-[2024-08-03 15:13:52] [Rank 0] totoal_tokens=5034, outputs='A'
-t.jsonl:  21%|██▏       | 157/734 [00:34<02:29,  3.86it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  22%|██▏       | 158/734 [00:34<04:09,  2.31it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  22%|██▏       | 159/734 [00:35<03:30,  2.73it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  22%|██▏       | 160/734 [00:35<03:19,  2.88it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  22%|██▏       | 161/734 [00:35<02:52,  3.32it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  22%|██▏       | 162/734 [00:35<02:55,  3.26it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  22%|██▏       | 163/734 [00:36<03:00,  3.16it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  22%|██▏       | 164/734 [00:36<02:55,  3.25it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  22%|██▏       | 165/734 [00:36<02:38,  3.60it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  23%|██▎       | 166/734 [00:37<02:44[2024-08-03 15:13:52] [Rank 3] totoal_tokens=5267, outputs='B'
-[2024-08-03 15:13:52] [Rank 2] totoal_tokens=5204, outputs='B'
-[2024-08-03 15:13:52] [Rank 1] totoal_tokens=5136, outputs='A'
-[2024-08-03 15:13:52] [Rank 0] totoal_tokens=5060, outputs='A'
-[2024-08-03 15:13:52] [Rank 3] totoal_tokens=5298, outputs='B'
-[2024-08-03 15:13:53] [Rank 1] totoal_tokens=5167, outputs='B'
-[2024-08-03 15:13:53] [Rank 0] totoal_tokens=5061, outputs='B'
-[2024-08-03 15:13:53] [Rank 2] totoal_tokens=5209, outputs='A'
-[2024-08-03 15:13:53] [Rank 3] totoal_tokens=5312, outputs='A'
-[2024-08-03 15:13:53] [Rank 1] totoal_tokens=5202, outputs='B'
-[2024-08-03 15:13:53] [Rank 0] totoal_tokens=5143, outputs='B'
-[2024-08-03 15:13:53] [Rank 2] totoal_tokens=5278, outputs='A'
-[2024-08-03 15:13:53] [Rank 0] totoal_tokens=5203, outputs='B'
-[2024-08-03 15:13:53] [Rank 1] totoal_tokens=5268, outputs='A'
-[2024-08-03 15:13:53] [Rank 2] totoal_tokens=5285, outputs='B'
-[2024-08-03 15:13:53] [Rank 3] totoal_tokens=5366, outputs='A'
-[2024-08-03 15:13:53] [Rank 0] totoal_tokens=5247, outputs='A'
-[2024-08-03 15:13:53] [Rank 2] totoal_tokens=5299, outputs='B'
-[2024-08-03 15:13:53] [Rank 1] totoal_tokens=5291, outputs='A'
-[2024-08-03 15:13:53] [Rank 3] totoal_tokens=5425, outputs='A'
-[2024-08-03 15:13:54] [Rank 0] totoal_tokens=5266, outputs='B'
-[2024-08-03 15:13:54] [Rank 2] totoal_tokens=5328, outputs='B'
-[2024-08-03 15:13:54] [Rank 1] totoal_tokens=5341, outputs='A'
-[2024-08-03 15:13:54] [Rank 3] totoal_tokens=5455, outputs='A'
-[2024-08-03 15:13:54] [Rank 0] totoal_tokens=5341, outputs='A'
-[2024-08-03 15:13:54] [Rank 1] totoal_tokens=5398, outputs='B'
-[2024-08-03 15:13:54] [Rank 2] totoal_tokens=5391, outputs='A'
-[2024-08-03 15:13:54] [Rank 3] totoal_tokens=5486, outputs='B'
-[2024-08-03 15:13:54] [Rank 1] totoal_tokens=5419, outputs='B'
-[2024-08-03 15:13:54] [Rank 0] totoal_tokens=5366, outputs='A'
-[2024-08-03 15:13:54] [Rank 3] totoal_tokens=5514, outputs='B'
-[2024-08-03 15:13:54] [Rank 2] totoal_tokens=5397, outputs='A'
-[2024-08-03 15:13:54] [Rank 1] totoal_tokens=5424, outputs='B'
-[2024-08-03 15:13:55] [Rank 0] totoal_tokens=5368, outputs='B'
-[2024-08-03 15:13:55] [Rank 3] totoal_tokens=5609, outputs='A'
-[2024-08-03 15:13:55] [Rank 1] totoal_tokens=5519, outputs='B'
-[2024-08-03 15:13:55] [Rank 2] totoal_tokens=5423, outputs='A'
-[2024-08-03 15:13:55] [Rank 0] totoal_tokens=5377, outputs='B'
-,  3.45it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  23%|██▎       | 167/734 [00:37<02:46,  3.41it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  23%|██▎       | 168/734 [00:37<02:29,  3.79it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  23%|██▎       | 169/734 [00:37<02:19,  4.04it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  23%|██▎       | 170/734 [00:37<02:16,  4.14it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  23%|██▎       | 171/734 [00:38<02:27,  3.81it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  23%|██▎       | 172/734 [00:38<02:26,  3.84it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  24%|██▎       | 173/734 [00:38<02:32,  3.67it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  24%|██▎       | 174/734 [00:39<03:01,  3.09it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  24%|██▍       | 175/734 [00:39<02:54,  3.21it/s]Processing InternVL2-2B_reasoning-image[2024-08-03 15:13:55] [Rank 3] totoal_tokens=5649, outputs='A'
-[2024-08-03 15:13:55] [Rank 1] totoal_tokens=5649, outputs='A'
-[2024-08-03 15:13:55] [Rank 2] totoal_tokens=5441, outputs='A'
-[2024-08-03 15:13:55] [Rank 0] totoal_tokens=5391, outputs='A'
-[2024-08-03 15:13:55] [Rank 3] totoal_tokens=5676, outputs='A'
-[2024-08-03 15:13:55] [Rank 1] totoal_tokens=5676, outputs='A'
-[2024-08-03 15:13:55] [Rank 2] totoal_tokens=5455, outputs='A'
-[2024-08-03 15:13:56] [Rank 0] totoal_tokens=5391, outputs='A'
-[2024-08-03 15:13:56] [Rank 1] totoal_tokens=5684, outputs='A'
-[2024-08-03 15:13:56] [Rank 3] totoal_tokens=5727, outputs='B'
-[2024-08-03 15:13:56] [Rank 2] totoal_tokens=5514, outputs='B'
-[2024-08-03 15:13:56] [Rank 0] totoal_tokens=5414, outputs='A'
-[2024-08-03 15:13:56] [Rank 3] totoal_tokens=5727, outputs='B'
-[2024-08-03 15:13:56] [Rank 2] totoal_tokens=5543, outputs='A'
-[2024-08-03 15:13:56] [Rank 1] totoal_tokens=5720, outputs='A'
-[2024-08-03 15:13:56] [Rank 0] totoal_tokens=5461, outputs='A'
-[2024-08-03 15:13:56] [Rank 2] totoal_tokens=5566, outputs='B'
-[2024-08-03 15:13:56] [Rank 1] totoal_tokens=5757, outputs='B'
-[2024-08-03 15:13:56] [Rank 3] totoal_tokens=5731, outputs='A'
-[2024-08-03 15:13:56] [Rank 0] totoal_tokens=5511, outputs='B'
-[2024-08-03 15:13:57] [Rank 2] totoal_tokens=5612, outputs='B'
-[2024-08-03 15:13:57] [Rank 1] totoal_tokens=5761, outputs='B'
-[2024-08-03 15:13:57] [Rank 3] totoal_tokens=5731, outputs='A'
-[2024-08-03 15:13:57] [Rank 0] totoal_tokens=5513, outputs='A'
-[2024-08-03 15:13:57] [Rank 2] totoal_tokens=5617, outputs='B'
-[2024-08-03 15:13:57] [Rank 1] totoal_tokens=5792, outputs='A'
-[2024-08-03 15:13:57] [Rank 3] totoal_tokens=5736, outputs='B'
-[2024-08-03 15:13:57] [Rank 0] totoal_tokens=5514, outputs='B'
-[2024-08-03 15:13:57] [Rank 1] totoal_tokens=5798, outputs='B'
-[2024-08-03 15:13:57] [Rank 2] totoal_tokens=5698, outputs='A'
-[2024-08-03 15:13:57] [Rank 3] totoal_tokens=5754, outputs='B'
-[2024-08-03 15:13:57] [Rank 0] totoal_tokens=5522, outputs='B'
-[2024-08-03 15:13:57] [Rank 2] totoal_tokens=5718, outputs='B'
-[2024-08-03 15:13:58] [Rank 3] totoal_tokens=5802, outputs='B'
-[2024-08-03 15:13:58] [Rank 0] totoal_tokens=5593, outputs='B'
--test.jsonl:  24%|██▍       | 176/734 [00:39<02:38,  3.53it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  24%|██▍       | 177/734 [00:40<02:48,  3.31it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  24%|██▍       | 178/734 [00:40<02:55,  3.17it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  24%|██▍       | 179/734 [00:40<02:59,  3.09it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  25%|██▍       | 180/734 [00:41<02:57,  3.12it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  25%|██▍       | 181/734 [00:41<02:40,  3.44it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  25%|██▍       | 182/734 [00:41<02:50,  3.24it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  25%|██▍       | 183/734 [00:42<02:51,  3.21it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  25%|██▌       | 184/734 [00:42<02:41,  3.40it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  25%|██▌       | 185/734 [00:42<0[2024-08-03 15:13:58] [Rank 1] totoal_tokens=5876, outputs='A'
-[2024-08-03 15:13:58] [Rank 2] totoal_tokens=5761, outputs='A'
-[2024-08-03 15:13:58] [Rank 3] totoal_tokens=5818, outputs='A'
-[2024-08-03 15:13:58] [Rank 1] totoal_tokens=5902, outputs='B'
-[2024-08-03 15:13:58] [Rank 0] totoal_tokens=5710, outputs='A'
-[2024-08-03 15:13:58] [Rank 2] totoal_tokens=5779, outputs='A'
-[2024-08-03 15:13:58] [Rank 0] totoal_tokens=5726, outputs='A'
-[2024-08-03 15:13:58] [Rank 3] totoal_tokens=5919, outputs='A'
-[2024-08-03 15:13:58] [Rank 1] totoal_tokens=5935, outputs='A'
-[2024-08-03 15:13:58] [Rank 2] totoal_tokens=5792, outputs='A'
-[2024-08-03 15:13:59] [Rank 0] totoal_tokens=5776, outputs='A'
-[2024-08-03 15:13:59] [Rank 1] totoal_tokens=5950, outputs='A'
-[2024-08-03 15:13:59] [Rank 3] totoal_tokens=5919, outputs='A'
-[2024-08-03 15:13:59] [Rank 2] totoal_tokens=5856, outputs='A'
-[2024-08-03 15:13:59] [Rank 0] totoal_tokens=5804, outputs='A'
-[2024-08-03 15:13:59] [Rank 1] totoal_tokens=5951, outputs='A'
-[2024-08-03 15:13:59] [Rank 3] totoal_tokens=5921, outputs='A'
-[2024-08-03 15:13:59] [Rank 2] totoal_tokens=5978, outputs='A'
-[2024-08-03 15:13:59] [Rank 0] totoal_tokens=5930, outputs='A'
-[2024-08-03 15:14:00] [Rank 1] totoal_tokens=5951, outputs='A'
-[2024-08-03 15:14:00] [Rank 3] totoal_tokens=5931, outputs='A'
-[2024-08-03 15:14:00] [Rank 2] totoal_tokens=6005, outputs='B'
-[2024-08-03 15:14:00] [Rank 0] totoal_tokens=6044, outputs='A'
-[2024-08-03 15:14:00] [Rank 2] totoal_tokens=6107, outputs='B'
-[2024-08-03 15:14:00] [Rank 1] totoal_tokens=5953, outputs='A'
-[2024-08-03 15:14:00] [Rank 3] totoal_tokens=5951, outputs='A'
-[2024-08-03 15:14:00] [Rank 0] totoal_tokens=6063, outputs='B'
-[2024-08-03 15:14:00] [Rank 2] totoal_tokens=6107, outputs='B'
-[2024-08-03 15:14:00] [Rank 3] totoal_tokens=5969, outputs='B'
-[2024-08-03 15:14:00] [Rank 1] totoal_tokens=5976, outputs='A'
-[2024-08-03 15:14:00] [Rank 0] totoal_tokens=6139, outputs='A'
-[2024-08-03 15:14:01] [Rank 2] totoal_tokens=6251, outputs='B'
-[2024-08-03 15:14:01] [Rank 3] totoal_tokens=5969, outputs='B'
-[2024-08-03 15:14:01] [Rank 1] totoal_tokens=6040, outputs='B'
-[2024-08-03 15:14:01] [Rank 2] totoal_tokens=6294, outputs='B'
-[2024-08-03 15:14:01] [Rank 3] totoal_tokens=6015, outputs='B'
-[2024-08-03 15:14:01] [Rank 1] totoal_tokens=6063, outputs='B'
-[2024-08-03 15:14:01] [Rank 0] totoal_tokens=6182, outputs='A'
-[2024-08-03 15:14:01] [Rank 2] totoal_tokens=6323, outputs='B'
-[2024-08-03 15:14:01] [Rank 3] totoal_tokens=6063, outputs='B'
-[2024-08-03 15:14:01] [Rank 1] totoal_tokens=6089, outputs='A'
-[2024-08-03 15:14:01] [Rank 2] totoal_tokens=6332, outputs='B'
-[2024-08-03 15:14:01] [Rank 0] totoal_tokens=6418, outputs='A'
-2:41,  3.40it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  25%|██▌       | 186/734 [00:42<02:50,  3.22it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  25%|██▌       | 187/734 [00:43<02:54,  3.13it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  26%|██▌       | 188/734 [00:43<02:57,  3.08it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  26%|██▌       | 189/734 [00:43<03:03,  2.97it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  26%|██▌       | 190/734 [00:44<03:04,  2.95it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  26%|██▌       | 191/734 [00:44<03:30,  2.58it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  26%|██▌       | 192/734 [00:45<03:07,  2.89it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  26%|██▋       | 193/734 [00:45<03:10,  2.84it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  26%|██▋       | 194/734 [00:45<03:37,  2.48it/s]Processing InternVL2-2B_reasoning-i[2024-08-03 15:14:01] [Rank 3] totoal_tokens=6079, outputs='B'
-[2024-08-03 15:14:02] [Rank 0] totoal_tokens=6484, outputs='B'
-[2024-08-03 15:14:02] [Rank 3] totoal_tokens=6087, outputs='A'
-[2024-08-03 15:14:02] [Rank 2] totoal_tokens=6396, outputs='A'
-[2024-08-03 15:14:02] [Rank 1] totoal_tokens=6166, outputs='A'
-[2024-08-03 15:14:02] [Rank 0] totoal_tokens=6495, outputs='A'
-[2024-08-03 15:14:02] [Rank 3] totoal_tokens=6089, outputs='A'
-[2024-08-03 15:14:02] [Rank 1] totoal_tokens=6189, outputs='B'
-[2024-08-03 15:14:02] [Rank 2] totoal_tokens=6414, outputs='A'
-[2024-08-03 15:14:02] [Rank 0] totoal_tokens=6576, outputs='A'
-[2024-08-03 15:14:02] [Rank 1] totoal_tokens=6212, outputs='B'
-[2024-08-03 15:14:03] [Rank 3] totoal_tokens=6159, outputs='A'
-[2024-08-03 15:14:03] [Rank 2] totoal_tokens=6418, outputs='A'
-[2024-08-03 15:14:03] [Rank 0] totoal_tokens=6607, outputs='B'
-[2024-08-03 15:14:03] [Rank 3] totoal_tokens=6242, outputs='B'
-[2024-08-03 15:14:03] [Rank 1] totoal_tokens=6260, outputs='B'
-[2024-08-03 15:14:03] [Rank 2] totoal_tokens=6485, outputs='A'
-[2024-08-03 15:14:03] [Rank 0] totoal_tokens=6624, outputs='A'
-[2024-08-03 15:14:03] [Rank 1] totoal_tokens=6260, outputs='B'
-[2024-08-03 15:14:03] [Rank 3] totoal_tokens=6287, outputs='A'
-[2024-08-03 15:14:03] [Rank 2] totoal_tokens=6570, outputs='A'
-[2024-08-03 15:14:04] [Rank 0] totoal_tokens=6646, outputs='A'
-[2024-08-03 15:14:04] [Rank 1] totoal_tokens=6269, outputs='A'
-[2024-08-03 15:14:04] [Rank 3] totoal_tokens=6304, outputs='A'
-[2024-08-03 15:14:04] [Rank 0] totoal_tokens=6801, outputs='B'
-[2024-08-03 15:14:04] [Rank 1] totoal_tokens=6373, outputs='B'
-[2024-08-03 15:14:04] [Rank 2] totoal_tokens=6597, outputs='A'
-[2024-08-03 15:14:04] [Rank 3] totoal_tokens=6334, outputs='A'
-[2024-08-03 15:14:04] [Rank 2] totoal_tokens=6623, outputs='B'
-[2024-08-03 15:14:04] [Rank 1] totoal_tokens=6379, outputs='A'
-[2024-08-03 15:14:04] [Rank 0] totoal_tokens=6803, outputs='A'
-[2024-08-03 15:14:04] [Rank 3] totoal_tokens=6354, outputs='A'
-[2024-08-03 15:14:05] [Rank 1] totoal_tokens=6489, outputs='B'
-[2024-08-03 15:14:05] [Rank 2] totoal_tokens=6707, outputs='A'
-[2024-08-03 15:14:05] [Rank 0] totoal_tokens=6826, outputs='A'
-mage-test.jsonl:  27%|██▋       | 195/734 [00:46<03:33,  2.52it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  27%|██▋       | 196/734 [00:46<03:15,  2.76it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  27%|██▋       | 197/734 [00:46<03:15,  2.75it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  27%|██▋       | 198/734 [00:47<03:16,  2.73it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  27%|██▋       | 199/734 [00:47<03:10,  2.81it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  27%|██▋       | 200/734 [00:48<03:19,  2.68it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  27%|██▋       | 201/734 [00:48<03:19,  2.67it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  28%|██▊       | 202/734 [00:48<03:09,  2.80it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  28%|██▊       | 203/734 [00:49<03:21,  2.64it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  28%|██▊       | 204/734 [00:[2024-08-03 15:14:05] [Rank 3] totoal_tokens=6443, outputs='A'
-[2024-08-03 15:14:05] [Rank 1] totoal_tokens=6576, outputs='A'
-[2024-08-03 15:14:05] [Rank 2] totoal_tokens=6713, outputs='B'
-[2024-08-03 15:14:05] [Rank 0] totoal_tokens=6899, outputs='B'
-[2024-08-03 15:14:05] [Rank 1] totoal_tokens=6634, outputs='B'
-[2024-08-03 15:14:05] [Rank 2] totoal_tokens=6958, outputs='B'
-[2024-08-03 15:14:05] [Rank 0] totoal_tokens=6918, outputs='B'
-[2024-08-03 15:14:05] [Rank 3] totoal_tokens=6571, outputs='A'
-[2024-08-03 15:14:06] [Rank 2] totoal_tokens=7033, outputs='B'
-[2024-08-03 15:14:06] [Rank 1] totoal_tokens=6712, outputs='A'
-[2024-08-03 15:14:06] [Rank 0] totoal_tokens=6955, outputs='A'
-[2024-08-03 15:14:06] [Rank 3] totoal_tokens=6639, outputs='A'
-[2024-08-03 15:14:06] [Rank 0] totoal_tokens=6972, outputs='B'
-[2024-08-03 15:14:06] [Rank 1] totoal_tokens=6722, outputs='A'
-[2024-08-03 15:14:06] [Rank 2] totoal_tokens=7041, outputs='B'
-[2024-08-03 15:14:06] [Rank 3] totoal_tokens=6646, outputs='A'
-[2024-08-03 15:14:06] [Rank 2] totoal_tokens=7119, outputs='B'
-[2024-08-03 15:14:06] [Rank 0] totoal_tokens=7028, outputs='A'
-[2024-08-03 15:14:06] [Rank 1] totoal_tokens=6739, outputs='A'
-[2024-08-03 15:14:07] [Rank 3] totoal_tokens=6660, outputs='A'
-[2024-08-03 15:14:07] [Rank 0] totoal_tokens=7056, outputs='B'
-[2024-08-03 15:14:07] [Rank 2] totoal_tokens=7178, outputs='B'
-[2024-08-03 15:14:07] [Rank 1] totoal_tokens=6801, outputs='B'
-[2024-08-03 15:14:07] [Rank 3] totoal_tokens=6707, outputs='A'
-[2024-08-03 15:14:07] [Rank 0] totoal_tokens=7090, outputs='B'
-[2024-08-03 15:14:07] [Rank 2] totoal_tokens=7218, outputs='A'
-[2024-08-03 15:14:07] [Rank 3] totoal_tokens=6768, outputs='B'
-[2024-08-03 15:14:07] [Rank 1] totoal_tokens=6851, outputs='A'
-[2024-08-03 15:14:07] [Rank 0] totoal_tokens=7187, outputs='A'
-[2024-08-03 15:14:08] [Rank 3] totoal_tokens=6962, outputs='A'
-[2024-08-03 15:14:08] [Rank 1] totoal_tokens=7000, outputs='A'
-[2024-08-03 15:14:08] [Rank 2] totoal_tokens=7228, outputs='B'
-[2024-08-03 15:14:08] [Rank 0] totoal_tokens=7218, outputs='A'
-[2024-08-03 15:14:08] [Rank 3] totoal_tokens=7040, outputs='B'
-[2024-08-03 15:14:08] [Rank 1] totoal_tokens=7109, outputs='B'
-[2024-08-03 15:14:08] [Rank 2] totoal_tokens=7263, outputs='A'
-[2024-08-03 15:14:08] [Rank 0] totoal_tokens=7220, outputs='B'
-49<03:22,  2.61it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  28%|██▊       | 205/734 [00:49<03:06,  2.83it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  28%|██▊       | 206/734 [00:50<03:09,  2.78it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  28%|██▊       | 207/734 [00:50<02:58,  2.96it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  28%|██▊       | 208/734 [00:50<03:04,  2.86it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  28%|██▊       | 209/734 [00:51<03:10,  2.76it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  29%|██▊       | 210/734 [00:51<02:58,  2.94it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  29%|██▊       | 211/734 [00:51<02:52,  3.03it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  29%|██▉       | 212/734 [00:52<03:09,  2.76it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  29%|██▉       | 213/734 [00:52<03:12,  2.71it/s]Processing InternVL2-2B_reasoni[2024-08-03 15:14:08] [Rank 3] totoal_tokens=7056, outputs='B'
-[2024-08-03 15:14:08] [Rank 1] totoal_tokens=7197, outputs='B'
-[2024-08-03 15:14:09] [Rank 2] totoal_tokens=7271, outputs='A'
-[2024-08-03 15:14:09] [Rank 3] totoal_tokens=7056, outputs='B'
-[2024-08-03 15:14:09] [Rank 0] totoal_tokens=7263, outputs='A'
-[2024-08-03 15:14:09] [Rank 1] totoal_tokens=7212, outputs='A'
-[2024-08-03 15:14:09] [Rank 2] totoal_tokens=7402, outputs='B'
-[2024-08-03 15:14:09] [Rank 3] totoal_tokens=7163, outputs='B'
-[2024-08-03 15:14:09] [Rank 0] totoal_tokens=7291, outputs='B'
-[2024-08-03 15:14:09] [Rank 1] totoal_tokens=7212, outputs='A'
-[2024-08-03 15:14:09] [Rank 3] totoal_tokens=7221, outputs='A'
-[2024-08-03 15:14:09] [Rank 2] totoal_tokens=7406, outputs='B'
-[2024-08-03 15:14:09] [Rank 0] totoal_tokens=7323, outputs='A'
-[2024-08-03 15:14:10] [Rank 1] totoal_tokens=7233, outputs='B'
-[2024-08-03 15:14:10] [Rank 2] totoal_tokens=7584, outputs='A'
-[2024-08-03 15:14:10] [Rank 0] totoal_tokens=7358, outputs='A'
-[2024-08-03 15:14:10] [Rank 1] totoal_tokens=7279, outputs='B'
-[2024-08-03 15:14:10] [Rank 3] totoal_tokens=7361, outputs='A'
-[2024-08-03 15:14:10] [Rank 2] totoal_tokens=7664, outputs='A'
-[2024-08-03 15:14:10] [Rank 1] totoal_tokens=7294, outputs='B'
-[2024-08-03 15:14:10] [Rank 0] totoal_tokens=7464, outputs='A'
-[2024-08-03 15:14:10] [Rank 3] totoal_tokens=7488, outputs='B'
-[2024-08-03 15:14:10] [Rank 2] totoal_tokens=7722, outputs='B'
-[2024-08-03 15:14:11] [Rank 3] totoal_tokens=7554, outputs='B'
-[2024-08-03 15:14:11] [Rank 1] totoal_tokens=7300, outputs='A'
-[2024-08-03 15:14:11] [Rank 0] totoal_tokens=7476, outputs='B'
-[2024-08-03 15:14:11] [Rank 2] totoal_tokens=7813, outputs='A'
-[2024-08-03 15:14:11] [Rank 1] totoal_tokens=7343, outputs='B'
-[2024-08-03 15:14:11] [Rank 0] totoal_tokens=7557, outputs='A'
-[2024-08-03 15:14:11] [Rank 3] totoal_tokens=7694, outputs='A'
-[2024-08-03 15:14:11] [Rank 2] totoal_tokens=8162, outputs='B'
-[2024-08-03 15:14:11] [Rank 1] totoal_tokens=7488, outputs='A'
-[2024-08-03 15:14:12] [Rank 3] totoal_tokens=7721, outputs='B'
-[2024-08-03 15:14:12] [Rank 0] totoal_tokens=7601, outputs='A'
-[2024-08-03 15:14:12] [Rank 2] totoal_tokens=8267, outputs='A'
-[2024-08-03 15:14:12] [Rank 1] totoal_tokens=7532, outputs='B'
-[2024-08-03 15:14:12] [Rank 3] totoal_tokens=7731, outputs='B'
-[2024-08-03 15:14:12] [Rank 0] totoal_tokens=7608, outputs='B'
-ng-image-test.jsonl:  29%|██▉       | 214/734 [00:53<03:01,  2.86it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  29%|██▉       | 215/734 [00:53<03:22,  2.57it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  29%|██▉       | 216/734 [00:53<03:10,  2.72it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  30%|██▉       | 217/734 [00:54<03:15,  2.65it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  30%|██▉       | 218/734 [00:54<03:31,  2.44it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  30%|██▉       | 219/734 [00:55<03:45,  2.28it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  30%|██▉       | 220/734 [00:55<03:42,  2.31it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  30%|███       | 221/734 [00:56<03:47,  2.26it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  30%|███       | 222/734 [00:56<03:47,  2.25it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  30%|███       | 223/734 [2024-08-03 15:14:12] [Rank 1] totoal_tokens=7557, outputs='A'
-[2024-08-03 15:14:12] [Rank 2] totoal_tokens=8275, outputs='A'
-[2024-08-03 15:14:12] [Rank 0] totoal_tokens=7684, outputs='B'
-[2024-08-03 15:14:12] [Rank 3] totoal_tokens=7848, outputs='A'
-[2024-08-03 15:14:13] [Rank 1] totoal_tokens=7609, outputs='A'
-[2024-08-03 15:14:13] [Rank 3] totoal_tokens=7857, outputs='B'
-[2024-08-03 15:14:13] [Rank 0] totoal_tokens=7810, outputs='A'
-[2024-08-03 15:14:13] [Rank 2] totoal_tokens=8300, outputs='A'
-[2024-08-03 15:14:13] [Rank 1] totoal_tokens=7684, outputs='A'
-[2024-08-03 15:14:13] [Rank 3] totoal_tokens=7948, outputs='B'
-[2024-08-03 15:14:13] [Rank 0] totoal_tokens=7840, outputs='B'
-[2024-08-03 15:14:13] [Rank 2] totoal_tokens=8387, outputs='A'
-[2024-08-03 15:14:14] [Rank 3] totoal_tokens=7960, outputs='B'
-[2024-08-03 15:14:14] [Rank 1] totoal_tokens=7713, outputs='B'
-[2024-08-03 15:14:14] [Rank 2] totoal_tokens=8417, outputs='B'
-[2024-08-03 15:14:14] [Rank 0] totoal_tokens=7970, outputs='A'
-[2024-08-03 15:14:14] [Rank 3] totoal_tokens=8001, outputs='A'
-[2024-08-03 15:14:14] [Rank 1] totoal_tokens=7717, outputs='A'
-[2024-08-03 15:14:14] [Rank 0] totoal_tokens=8060, outputs='B'
-[2024-08-03 15:14:14] [Rank 2] totoal_tokens=8522, outputs='A'
-[2024-08-03 15:14:14] [Rank 3] totoal_tokens=8046, outputs='A'
-[2024-08-03 15:14:15] [Rank 1] totoal_tokens=7719, outputs='A'
-[2024-08-03 15:14:15] [Rank 0] totoal_tokens=8075, outputs='A'
-[2024-08-03 15:14:15] [Rank 2] totoal_tokens=8563, outputs='A'
-[2024-08-03 15:14:15] [Rank 3] totoal_tokens=8121, outputs='B'
-[2024-08-03 15:14:15] [Rank 1] totoal_tokens=7731, outputs='B'
-[2024-08-03 15:14:15] [Rank 0] totoal_tokens=8160, outputs='A'
-[2024-08-03 15:14:15] [Rank 3] totoal_tokens=8174, outputs='B'
-[2024-08-03 15:14:15] [Rank 2] totoal_tokens=8597, outputs='A'
-[2024-08-03 15:14:16] [Rank 1] totoal_tokens=7763, outputs='A'
-[2024-08-03 15:14:16] [Rank 0] totoal_tokens=8256, outputs='A'
-[2024-08-03 15:14:16] [Rank 3] totoal_tokens=8433, outputs='A'
-[2024-08-03 15:14:16] [Rank 2] totoal_tokens=8609, outputs='A'
-[2024-08-03 15:14:16] [Rank 1] totoal_tokens=8018, outputs='A'
-[2024-08-03 15:14:16] [Rank 0] totoal_tokens=8300, outputs='B'
-[2024-08-03 15:14:16] [Rank 3] totoal_tokens=8563, outputs='A'
-[2024-08-03 15:14:16] [Rank 1] totoal_tokens=8026, outputs='B'
-[2024-08-03 15:14:16] [Rank 2] totoal_tokens=8628, outputs='A'
-[2024-08-03 15:14:17] [Rank 0] totoal_tokens=8362, outputs='A'
-[00:56<03:31,  2.42it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  31%|███       | 224/734 [00:57<03:20,  2.55it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  31%|███       | 225/734 [00:57<03:48,  2.22it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  31%|███       | 226/734 [00:58<03:32,  2.39it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  31%|███       | 227/734 [00:58<03:53,  2.17it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  31%|███       | 228/734 [00:59<03:36,  2.34it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  31%|███       | 229/734 [00:59<03:58,  2.12it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  31%|███▏      | 230/734 [01:00<04:02,  2.08it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  31%|███▏      | 231/734 [01:00<03:59,  2.10it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  32%|███▏      | 232/734 [01:01<03:43,  2.25it/s]Processing InternVL2-[2024-08-03 15:14:17] [Rank 3] totoal_tokens=8581, outputs='B'
-[2024-08-03 15:14:17] [Rank 1] totoal_tokens=8074, outputs='A'
-[2024-08-03 15:14:17] [Rank 2] totoal_tokens=8650, outputs='A'
-[2024-08-03 15:14:17] [Rank 0] totoal_tokens=8438, outputs='B'
-[2024-08-03 15:14:17] [Rank 3] totoal_tokens=8604, outputs='B'
-[2024-08-03 15:14:17] [Rank 1] totoal_tokens=8126, outputs='B'
-[2024-08-03 15:14:17] [Rank 0] totoal_tokens=8490, outputs='B'
-[2024-08-03 15:14:17] [Rank 2] totoal_tokens=8680, outputs='A'
-[2024-08-03 15:14:18] [Rank 3] totoal_tokens=8621, outputs='A'
-[2024-08-03 15:14:18] [Rank 1] totoal_tokens=8191, outputs='A'
-[2024-08-03 15:14:18] [Rank 0] totoal_tokens=8517, outputs='B'
-[2024-08-03 15:14:18] [Rank 2] totoal_tokens=8787, outputs='A'
-[2024-08-03 15:14:18] [Rank 3] totoal_tokens=8665, outputs='B'
-[2024-08-03 15:14:18] [Rank 0] totoal_tokens=8563, outputs='A'
-[2024-08-03 15:14:18] [Rank 1] totoal_tokens=8208, outputs='A'
-[2024-08-03 15:14:18] [Rank 2] totoal_tokens=8791, outputs='B'
-[2024-08-03 15:14:18] [Rank 3] totoal_tokens=8741, outputs='A'
-[2024-08-03 15:14:19] [Rank 0] totoal_tokens=8691, outputs='A'
-[2024-08-03 15:14:19] [Rank 1] totoal_tokens=8241, outputs='A'
-[2024-08-03 15:14:19] [Rank 2] totoal_tokens=9065, outputs='A'
-[2024-08-03 15:14:19] [Rank 3] totoal_tokens=8749, outputs='A'
-[2024-08-03 15:14:19] [Rank 0] totoal_tokens=8723, outputs='B'
-[2024-08-03 15:14:19] [Rank 2] totoal_tokens=9101, outputs='B'
-[2024-08-03 15:14:20] [Rank 2] totoal_tokens=9142, outputs='B'
-[2024-08-03 15:14:20] [Rank 1] totoal_tokens=8340, outputs='A'
-[2024-08-03 15:14:20] [Rank 3] totoal_tokens=8749, outputs='A'
-[2024-08-03 15:14:20] [Rank 2] totoal_tokens=9142, outputs='B'
-[2024-08-03 15:14:20] [Rank 1] totoal_tokens=8408, outputs='B'
-[2024-08-03 15:14:20] [Rank 3] totoal_tokens=8753, outputs='B'
-[2024-08-03 15:14:21] [Rank 1] totoal_tokens=8465, outputs='A'
-[2024-08-03 15:14:21] [Rank 2] totoal_tokens=9256, outputs='A'
-[2024-08-03 15:14:21] [Rank 3] totoal_tokens=8770, outputs='A'
-[2024-08-03 15:14:21] [Rank 0] totoal_tokens=8736, outputs='A'
-[2024-08-03 15:14:22] [Rank 0] totoal_tokens=8753, outputs='B'
-[2024-08-03 15:14:22] [Rank 1] totoal_tokens=8506, outputs='A'
-[2024-08-03 15:14:22] [Rank 3] totoal_tokens=8830, outputs='A'
-[2024-08-03 15:14:22] [Rank 2] totoal_tokens=9396, outputs='A'
-[2024-08-03 15:14:22] [Rank 0] totoal_tokens=8786, outputs='B'
-2B_reasoning-image-test.jsonl:  32%|███▏      | 233/734 [01:01<03:43,  2.24it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  32%|███▏      | 234/734 [01:01<03:30,  2.38it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  32%|███▏      | 235/734 [01:02<03:32,  2.35it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  32%|███▏      | 236/734 [01:02<03:24,  2.43it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  32%|███▏      | 237/734 [01:03<03:33,  2.33it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  32%|███▏      | 238/734 [01:03<03:42,  2.22it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  33%|███▎      | 239/734 [01:03<03:33,  2.32it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  33%|███▎      | 240/734 [01:05<06:55,  1.19it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  33%|███▎      | 241/734 [01:06<06:34,  1.25it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  33[2024-08-03 15:14:22] [Rank 2] totoal_tokens=9434, outputs='B'
-[2024-08-03 15:14:22] [Rank 1] totoal_tokens=8674, outputs='A'
-[2024-08-03 15:14:22] [Rank 3] totoal_tokens=9054, outputs='A'
-[2024-08-03 15:14:23] [Rank 0] totoal_tokens=8820, outputs='A'
-[2024-08-03 15:14:23] [Rank 3] totoal_tokens=9072, outputs='B'
-[2024-08-03 15:14:23] [Rank 1] totoal_tokens=8674, outputs='A'
-[2024-08-03 15:14:23] [Rank 2] totoal_tokens=9464, outputs='A'
-[2024-08-03 15:14:23] [Rank 0] totoal_tokens=8901, outputs='B'
-[2024-08-03 15:14:23] [Rank 3] totoal_tokens=9126, outputs='A'
-[2024-08-03 15:14:23] [Rank 1] totoal_tokens=8680, outputs='A'
-[2024-08-03 15:14:24] [Rank 0] totoal_tokens=8904, outputs='A'
-[2024-08-03 15:14:24] [Rank 2] totoal_tokens=9500, outputs='A'
-[2024-08-03 15:14:24] [Rank 3] totoal_tokens=9140, outputs='B'
-[2024-08-03 15:14:24] [Rank 1] totoal_tokens=8699, outputs='A'
-[2024-08-03 15:14:24] [Rank 0] totoal_tokens=8982, outputs='B'
-[2024-08-03 15:14:24] [Rank 3] totoal_tokens=9195, outputs='A'
-[2024-08-03 15:14:24] [Rank 1] totoal_tokens=8723, outputs='A'
-[2024-08-03 15:14:24] [Rank 0] totoal_tokens=9171, outputs='B'
-[2024-08-03 15:14:24] [Rank 2] totoal_tokens=9525, outputs='A'
-[2024-08-03 15:14:25] [Rank 3] totoal_tokens=9195, outputs='B'
-[2024-08-03 15:14:25] [Rank 1] totoal_tokens=8806, outputs='B'
-[2024-08-03 15:14:25] [Rank 0] totoal_tokens=9195, outputs='A'
-[2024-08-03 15:14:25] [Rank 2] totoal_tokens=9588, outputs='B'
-[2024-08-03 15:14:25] [Rank 1] totoal_tokens=8832, outputs='B'
-[2024-08-03 15:14:25] [Rank 3] totoal_tokens=9236, outputs='A'
-[2024-08-03 15:14:25] [Rank 2] totoal_tokens=9642, outputs='A'
-[2024-08-03 15:14:26] [Rank 0] totoal_tokens=9236, outputs='A'
-[2024-08-03 15:14:26] [Rank 1] totoal_tokens=8883, outputs='A'
-[2024-08-03 15:14:26] [Rank 1] totoal_tokens=9087, outputs='B'
-[2024-08-03 15:14:26] [Rank 3] totoal_tokens=9358, outputs='A'
-[2024-08-03 15:14:26] [Rank 2] totoal_tokens=9665, outputs='A'
-[2024-08-03 15:14:26] [Rank 0] totoal_tokens=9236, outputs='A'
-[2024-08-03 15:14:26] [Rank 1] totoal_tokens=9190, outputs='B'
-[2024-08-03 15:14:27] [Rank 3] totoal_tokens=9406, outputs='A'
-[2024-08-03 15:14:27] [Rank 2] totoal_tokens=9681, outputs='B'
-[2024-08-03 15:14:27] [Rank 0] totoal_tokens=9286, outputs='A'
-%|███▎      | 242/734 [01:07<06:15,  1.31it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  33%|███▎      | 243/734 [01:07<05:32,  1.47it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  33%|███▎      | 244/734 [01:08<04:48,  1.70it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  33%|███▎      | 245/734 [01:08<04:31,  1.80it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  34%|███▎      | 246/734 [01:08<04:04,  1.99it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  34%|███▎      | 247/734 [01:09<03:51,  2.11it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  34%|███▍      | 248/734 [01:09<03:55,  2.07it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  34%|███▍      | 249/734 [01:10<04:26,  1.82it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  34%|███▍      | 250/734 [01:11<04:48,  1.68it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  34%|███▍      | 251/734 [01:[2024-08-03 15:14:27] [Rank 1] totoal_tokens=9281, outputs='A'
-[2024-08-03 15:14:27] [Rank 3] totoal_tokens=9487, outputs='A'
-[2024-08-03 15:14:27] [Rank 2] totoal_tokens=9682, outputs='A'
-[2024-08-03 15:14:27] [Rank 0] totoal_tokens=9291, outputs='A'
-[2024-08-03 15:14:28] [Rank 3] totoal_tokens=9492, outputs='B'
-[2024-08-03 15:14:28] [Rank 1] totoal_tokens=9315, outputs='A'
-[2024-08-03 15:14:28] [Rank 2] totoal_tokens=9713, outputs='A'
-[2024-08-03 15:14:28] [Rank 3] totoal_tokens=9564, outputs='B'
-[2024-08-03 15:14:28] [Rank 1] totoal_tokens=9335, outputs='B'
-[2024-08-03 15:14:28] [Rank 2] totoal_tokens=9739, outputs='A'
-[2024-08-03 15:14:28] [Rank 0] totoal_tokens=9465, outputs='A'
-[2024-08-03 15:14:28] [Rank 3] totoal_tokens=9564, outputs='B'
-[2024-08-03 15:14:29] [Rank 1] totoal_tokens=9382, outputs='A'
-[2024-08-03 15:14:29] [Rank 2] totoal_tokens=9809, outputs='B'
-[2024-08-03 15:14:29] [Rank 3] totoal_tokens=9575, outputs='B'
-[2024-08-03 15:14:29] [Rank 1] totoal_tokens=9487, outputs='A'
-[2024-08-03 15:14:29] [Rank 0] totoal_tokens=9465, outputs='A'
-[2024-08-03 15:14:29] [Rank 2] totoal_tokens=9810, outputs='A'
-[2024-08-03 15:14:29] [Rank 3] totoal_tokens=9579, outputs='A'
-[2024-08-03 15:14:30] [Rank 1] totoal_tokens=9492, outputs='A'
-[2024-08-03 15:14:30] [Rank 2] totoal_tokens=9837, outputs='B'
-[2024-08-03 15:14:30] [Rank 3] totoal_tokens=9591, outputs='B'
-[2024-08-03 15:14:30] [Rank 0] totoal_tokens=9494, outputs='A'
-[2024-08-03 15:14:30] [Rank 2] totoal_tokens=9852, outputs='B'
-[2024-08-03 15:14:30] [Rank 1] totoal_tokens=9522, outputs='B'
-[2024-08-03 15:14:30] [Rank 3] totoal_tokens=9680, outputs='B'
-[2024-08-03 15:14:31] [Rank 1] totoal_tokens=9525, outputs='B'
-[2024-08-03 15:14:31] [Rank 2] totoal_tokens=9897, outputs='A'
-[2024-08-03 15:14:31] [Rank 3] totoal_tokens=9709, outputs='B'
-[2024-08-03 15:14:31] [Rank 0] totoal_tokens=9494, outputs='A'
-[2024-08-03 15:14:31] [Rank 1] totoal_tokens=9548, outputs='A'
-[2024-08-03 15:14:31] [Rank 2] totoal_tokens=9965, outputs='A'
-[2024-08-03 15:14:31] [Rank 3] totoal_tokens=9713, outputs='A'
-[2024-08-03 15:14:32] [Rank 1] totoal_tokens=9575, outputs='B'
-[2024-08-03 15:14:32] [Rank 0] totoal_tokens=9519, outputs='A'
-[2024-08-03 15:14:32] [Rank 3] totoal_tokens=9915, outputs='A'
-[2024-08-03 15:14:32] [Rank 1] totoal_tokens=9588, outputs='B'
-[2024-08-03 15:14:32] [Rank 0] totoal_tokens=9588, outputs='B'
-[2024-08-03 15:14:32] [Rank 2] totoal_tokens=9988, outputs='A'
-[2024-08-03 15:14:32] [Rank 3] totoal_tokens=9939, outputs='A'
-[2024-08-03 15:14:33] [Rank 0] totoal_tokens=9626, outputs='B'
-[2024-08-03 15:14:33] [Rank 1] totoal_tokens=9773, outputs='A'
-[2024-08-03 15:14:33] [Rank 2] totoal_tokens=9994, outputs='B'
-[2024-08-03 15:14:33] [Rank 0] totoal_tokens=9779, outputs='B'
-[2024-08-03 15:14:33] [Rank 2] totoal_tokens=10009, outputs='B'
-[2024-08-03 15:14:33] [Rank 1] totoal_tokens=9809, outputs='B'
-[2024-08-03 15:14:33] [Rank 3] totoal_tokens=9978, outputs='A'
-[2024-08-03 15:14:34] [Rank 0] totoal_tokens=9852, outputs='B'
-11<04:48,  1.68it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  34%|███▍      | 252/734 [01:12<04:51,  1.65it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  34%|███▍      | 253/734 [01:13<05:24,  1.48it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  35%|███▍      | 254/734 [01:14<05:45,  1.39it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  35%|███▍      | 255/734 [01:14<06:00,  1.33it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  35%|███▍      | 256/734 [01:15<06:06,  1.31it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  35%|███▌      | 257/734 [01:16<06:18,  1.26it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  35%|███▌      | 258/734 [01:17<05:39,  1.40it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  35%|███▌      | 259/734 [01:17<05:09,  1.53it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  35%|███▌      | 260/734 [01:18<04:38,  1.70it/s]Processing In[2024-08-03 15:14:34] [Rank 1] totoal_tokens=9883, outputs='B'
-[2024-08-03 15:14:34] [Rank 2] totoal_tokens=10030, outputs='A'
-[2024-08-03 15:14:34] [Rank 3] totoal_tokens=10010, outputs='A'
-[2024-08-03 15:14:34] [Rank 1] totoal_tokens=9926, outputs='B'
-[2024-08-03 15:14:34] [Rank 2] totoal_tokens=10045, outputs='B'
-[2024-08-03 15:14:34] [Rank 0] totoal_tokens=9903, outputs='B'
-[2024-08-03 15:14:35] [Rank 3] totoal_tokens=10017, outputs='A'
-[2024-08-03 15:14:35] [Rank 1] totoal_tokens=10045, outputs='B'
-[2024-08-03 15:14:35] [Rank 2] totoal_tokens=10138, outputs='B'
-[2024-08-03 15:14:35] [Rank 3] totoal_tokens=10049, outputs='B'
-[2024-08-03 15:14:35] [Rank 0] totoal_tokens=9911, outputs='A'
-[2024-08-03 15:14:35] [Rank 1] totoal_tokens=10284, outputs='B'
-[2024-08-03 15:14:35] [Rank 2] totoal_tokens=10165, outputs='B'
-[2024-08-03 15:14:36] [Rank 0] totoal_tokens=10011, outputs='B'
-[2024-08-03 15:14:36] [Rank 3] totoal_tokens=10130, outputs='A'
-[2024-08-03 15:14:36] [Rank 1] totoal_tokens=10335, outputs='B'
-[2024-08-03 15:14:36] [Rank 2] totoal_tokens=10295, outputs='A'
-[2024-08-03 15:14:36] [Rank 0] totoal_tokens=10054, outputs='A'
-[2024-08-03 15:14:36] [Rank 1] totoal_tokens=10341, outputs='B'
-[2024-08-03 15:14:36] [Rank 3] totoal_tokens=10184, outputs='A'
-[2024-08-03 15:14:36] [Rank 2] totoal_tokens=10385, outputs='A'
-[2024-08-03 15:14:37] [Rank 0] totoal_tokens=10155, outputs='A'
-[2024-08-03 15:14:37] [Rank 1] totoal_tokens=10341, outputs='B'
-[2024-08-03 15:14:37] [Rank 2] totoal_tokens=10388, outputs='B'
-[2024-08-03 15:14:37] [Rank 3] totoal_tokens=10213, outputs='A'
-[2024-08-03 15:14:37] [Rank 0] totoal_tokens=10284, outputs='B'
-[2024-08-03 15:14:37] [Rank 1] totoal_tokens=10394, outputs='A'
-[2024-08-03 15:14:37] [Rank 3] totoal_tokens=10383, outputs='A'
-[2024-08-03 15:14:38] [Rank 2] totoal_tokens=10392, outputs='A'
-[2024-08-03 15:14:38] [Rank 0] totoal_tokens=10356, outputs='B'
-[2024-08-03 15:14:38] [Rank 1] totoal_tokens=10433, outputs='A'
-[2024-08-03 15:14:38] [Rank 3] totoal_tokens=10535, outputs='B'
-[2024-08-03 15:14:38] [Rank 2] totoal_tokens=10417, outputs='A'
-[2024-08-03 15:14:38] [Rank 0] totoal_tokens=10375, outputs='B'
-[2024-08-03 15:14:38] [Rank 1] totoal_tokens=10452, outputs='B'
-[2024-08-03 15:14:38] [Rank 3] totoal_tokens=10548, outputs='B'
-[2024-08-03 15:14:39] [Rank 2] totoal_tokens=10501, outputs='B'
-[2024-08-03 15:14:39] [Rank 0] totoal_tokens=10385, outputs='A'
-ternVL2-2B_reasoning-image-test.jsonl:  36%|███▌      | 261/734 [01:18<04:11,  1.88it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  36%|███▌      | 262/734 [01:19<05:05,  1.55it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  36%|███▌      | 263/734 [01:20<05:08,  1.53it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  36%|███▌      | 264/734 [01:20<04:41,  1.67it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  36%|███▌      | 265/734 [01:21<04:30,  1.73it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  36%|███▌      | 266/734 [01:21<04:25,  1.76it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  36%|███▋      | 267/734 [01:22<04:15,  1.83it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  37%|███▋      | 268/734 [01:22<04:08,  1.87it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  37%|███▋      | 269/734 [01:23<04:15,  1.82it/s]Processing InternVL2-2B_reasoning-image-test.js[2024-08-03 15:14:39] [Rank 1] totoal_tokens=10501, outputs='B'
-[2024-08-03 15:14:39] [Rank 3] totoal_tokens=10648, outputs='B'
-[2024-08-03 15:14:39] [Rank 2] totoal_tokens=10564, outputs='B'
-[2024-08-03 15:14:39] [Rank 0] totoal_tokens=10388, outputs='B'
-[2024-08-03 15:14:39] [Rank 1] totoal_tokens=10535, outputs='B'
-[2024-08-03 15:14:39] [Rank 3] totoal_tokens=10680, outputs='A'
-[2024-08-03 15:14:40] [Rank 2] totoal_tokens=10608, outputs='B'
-[2024-08-03 15:14:40] [Rank 0] totoal_tokens=10394, outputs='A'
-[2024-08-03 15:14:40] [Rank 3] totoal_tokens=10743, outputs='B'
-[2024-08-03 15:14:40] [Rank 1] totoal_tokens=10646, outputs='A'
-[2024-08-03 15:14:40] [Rank 2] totoal_tokens=10661, outputs='B'
-[2024-08-03 15:14:40] [Rank 0] totoal_tokens=10394, outputs='A'
-[2024-08-03 15:14:41] [Rank 3] totoal_tokens=10897, outputs='A'
-[2024-08-03 15:14:41] [Rank 1] totoal_tokens=10679, outputs='A'
-[2024-08-03 15:14:41] [Rank 2] totoal_tokens=10688, outputs='B'
-[2024-08-03 15:14:41] [Rank 0] totoal_tokens=10459, outputs='A'
-[2024-08-03 15:14:41] [Rank 1] totoal_tokens=10917, outputs='A'
-[2024-08-03 15:14:41] [Rank 2] totoal_tokens=10742, outputs='A'
-[2024-08-03 15:14:41] [Rank 3] totoal_tokens=10977, outputs='A'
-[2024-08-03 15:14:42] [Rank 0] totoal_tokens=10469, outputs='B'
-[2024-08-03 15:14:42] [Rank 2] totoal_tokens=10971, outputs='B'
-[2024-08-03 15:14:42] [Rank 0] totoal_tokens=10569, outputs='A'
-[2024-08-03 15:14:42] [Rank 3] totoal_tokens=11014, outputs='B'
-[2024-08-03 15:14:42] [Rank 1] totoal_tokens=10977, outputs='A'
-[2024-08-03 15:14:42] [Rank 2] totoal_tokens=11150, outputs='B'
-[2024-08-03 15:14:43] [Rank 0] totoal_tokens=10574, outputs='A'
-[2024-08-03 15:14:43] [Rank 3] totoal_tokens=11026, outputs='A'
-[2024-08-03 15:14:43] [Rank 1] totoal_tokens=10980, outputs='A'
-[2024-08-03 15:14:43] [Rank 2] totoal_tokens=11190, outputs='B'
-[2024-08-03 15:14:43] [Rank 0] totoal_tokens=10585, outputs='A'
-[2024-08-03 15:14:43] [Rank 3] totoal_tokens=11092, outputs='A'
-[2024-08-03 15:14:43] [Rank 1] totoal_tokens=11093, outputs='B'
-[2024-08-03 15:14:44] [Rank 2] totoal_tokens=11367, outputs='A'
-[2024-08-03 15:14:44] [Rank 0] totoal_tokens=10608, outputs='B'
-onl:  37%|███▋      | 270/734 [01:23<04:18,  1.80it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  37%|███▋      | 271/734 [01:24<04:03,  1.90it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  37%|███▋      | 272/734 [01:24<04:13,  1.82it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  37%|███▋      | 273/734 [01:25<04:20,  1.77it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  37%|███▋      | 274/734 [01:25<04:23,  1.75it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  37%|███▋      | 275/734 [01:26<04:08,  1.85it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  38%|███▊      | 276/734 [01:27<04:08,  1.84it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  38%|███▊      | 277/734 [01:27<04:11,  1.81it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  38%|███▊      | 278/734 [01:28<04:09,  1.82it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  38%|███▊      | 279/[2024-08-03 15:14:44] [Rank 3] totoal_tokens=11136, outputs='B'
-[2024-08-03 15:14:44] [Rank 1] totoal_tokens=11147, outputs='A'
-[2024-08-03 15:14:44] [Rank 0] totoal_tokens=10661, outputs='B'
-[2024-08-03 15:14:44] [Rank 2] totoal_tokens=11393, outputs='A'
-[2024-08-03 15:14:44] [Rank 3] totoal_tokens=11136, outputs='B'
-[2024-08-03 15:14:44] [Rank 1] totoal_tokens=11160, outputs='B'
-[2024-08-03 15:14:45] [Rank 0] totoal_tokens=10673, outputs='B'
-[2024-08-03 15:14:45] [Rank 2] totoal_tokens=11460, outputs='B'
-[2024-08-03 15:14:45] [Rank 3] totoal_tokens=11160, outputs='B'
-[2024-08-03 15:14:45] [Rank 1] totoal_tokens=11176, outputs='A'
-[2024-08-03 15:14:45] [Rank 0] totoal_tokens=10720, outputs='A'
-[2024-08-03 15:14:45] [Rank 2] totoal_tokens=11485, outputs='A'
-[2024-08-03 15:14:46] [Rank 3] totoal_tokens=11285, outputs='B'
-[2024-08-03 15:14:46] [Rank 1] totoal_tokens=11176, outputs='B'
-[2024-08-03 15:14:46] [Rank 0] totoal_tokens=10808, outputs='A'
-[2024-08-03 15:14:46] [Rank 2] totoal_tokens=11497, outputs='A'
-[2024-08-03 15:14:46] [Rank 3] totoal_tokens=11326, outputs='B'
-[2024-08-03 15:14:46] [Rank 1] totoal_tokens=11255, outputs='B'
-[2024-08-03 15:14:46] [Rank 3] totoal_tokens=11343, outputs='B'
-[2024-08-03 15:14:47] [Rank 2] totoal_tokens=11505, outputs='A'
-[2024-08-03 15:14:47] [Rank 1] totoal_tokens=11278, outputs='B'
-[2024-08-03 15:14:47] [Rank 3] totoal_tokens=11438, outputs='B'
-[2024-08-03 15:14:47] [Rank 0] totoal_tokens=10833, outputs='A'
-[2024-08-03 15:14:47] [Rank 2] totoal_tokens=11557, outputs='A'
-[2024-08-03 15:14:47] [Rank 1] totoal_tokens=11305, outputs='A'
-[2024-08-03 15:14:48] [Rank 0] totoal_tokens=10917, outputs='A'
-[2024-08-03 15:14:48] [Rank 2] totoal_tokens=11605, outputs='A'
-[2024-08-03 15:14:48] [Rank 1] totoal_tokens=11424, outputs='A'
-[2024-08-03 15:14:48] [Rank 3] totoal_tokens=11440, outputs='A'
-[2024-08-03 15:14:48] [Rank 0] totoal_tokens=10987, outputs='A'
-[2024-08-03 15:14:48] [Rank 2] totoal_tokens=11654, outputs='A'
-[2024-08-03 15:14:49] [Rank 1] totoal_tokens=11497, outputs='A'
-[2024-08-03 15:14:49] [Rank 3] totoal_tokens=11495, outputs='A'
-[2024-08-03 15:14:49] [Rank 0] totoal_tokens=11020, outputs='B'
-[2024-08-03 15:14:49] [Rank 2] totoal_tokens=11669, outputs='A'
-[2024-08-03 15:14:49] [Rank 1] totoal_tokens=11524, outputs='A'
-[2024-08-03 15:14:49] [Rank 3] totoal_tokens=11592, outputs='A'
-[2024-08-03 15:14:50] [Rank 2] totoal_tokens=11693, outputs='B'
-[2024-08-03 15:14:50] [Rank 0] totoal_tokens=11081, outputs='A'
-[2024-08-03 15:14:50] [Rank 1] totoal_tokens=11588, outputs='B'
-[2024-08-03 15:14:50] [Rank 3] totoal_tokens=11605, outputs='A'
-[2024-08-03 15:14:50] [Rank 2] totoal_tokens=11758, outputs='B'
-[2024-08-03 15:14:50] [Rank 0] totoal_tokens=11136, outputs='B'
-734 [01:28<03:56,  1.92it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  38%|███▊      | 280/734 [01:29<03:53,  1.95it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  38%|███▊      | 281/734 [01:29<03:42,  2.03it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  38%|███▊      | 282/734 [01:30<03:57,  1.90it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  39%|███▊      | 283/734 [01:30<04:01,  1.87it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  39%|███▊      | 284/734 [01:32<05:54,  1.27it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  39%|███▉      | 285/734 [01:32<05:25,  1.38it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  39%|███▉      | 286/734 [01:33<05:17,  1.41it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  39%|███▉      | 287/734 [01:33<04:50,  1.54it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  39%|███▉      | 288/734 [01:34<05:23,  1.38it/s]Proce[2024-08-03 15:14:50] [Rank 1] totoal_tokens=11592, outputs='A'
-[2024-08-03 15:14:51] [Rank 3] totoal_tokens=11669, outputs='A'
-[2024-08-03 15:14:51] [Rank 2] totoal_tokens=11770, outputs='A'
-[2024-08-03 15:14:51] [Rank 0] totoal_tokens=11150, outputs='B'
-[2024-08-03 15:14:51] [Rank 1] totoal_tokens=11620, outputs='A'
-[2024-08-03 15:14:51] [Rank 3] totoal_tokens=11669, outputs='A'
-[2024-08-03 15:14:52] [Rank 2] totoal_tokens=11935, outputs='A'
-[2024-08-03 15:14:52] [Rank 1] totoal_tokens=11620, outputs='A'
-[2024-08-03 15:14:52] [Rank 3] totoal_tokens=11770, outputs='B'
-[2024-08-03 15:14:52] [Rank 0] totoal_tokens=11313, outputs='B'
-[2024-08-03 15:14:52] [Rank 1] totoal_tokens=11620, outputs='A'
-[2024-08-03 15:14:52] [Rank 2] totoal_tokens=12004, outputs='A'
-[2024-08-03 15:14:53] [Rank 3] totoal_tokens=11782, outputs='A'
-[2024-08-03 15:14:53] [Rank 0] totoal_tokens=11447, outputs='A'
-[2024-08-03 15:14:53] [Rank 1] totoal_tokens=11638, outputs='B'
-[2024-08-03 15:14:53] [Rank 2] totoal_tokens=12067, outputs='A'
-[2024-08-03 15:14:53] [Rank 3] totoal_tokens=11813, outputs='B'
-[2024-08-03 15:14:54] [Rank 0] totoal_tokens=11457, outputs='A'
-[2024-08-03 15:14:54] [Rank 1] totoal_tokens=11689, outputs='B'
-[2024-08-03 15:14:54] [Rank 0] totoal_tokens=11460, outputs='B'
-[2024-08-03 15:14:54] [Rank 2] totoal_tokens=12102, outputs='B'
-[2024-08-03 15:14:54] [Rank 1] totoal_tokens=11693, outputs='A'
-[2024-08-03 15:14:55] [Rank 0] totoal_tokens=11521, outputs='A'
-[2024-08-03 15:14:55] [Rank 3] totoal_tokens=11832, outputs='A'
-[2024-08-03 15:14:55] [Rank 2] totoal_tokens=12141, outputs='B'
-[2024-08-03 15:14:55] [Rank 1] totoal_tokens=11716, outputs='B'
-[2024-08-03 15:14:55] [Rank 3] totoal_tokens=11843, outputs='B'
-[2024-08-03 15:14:55] [Rank 0] totoal_tokens=11571, outputs='A'
-[2024-08-03 15:14:56] [Rank 1] totoal_tokens=11727, outputs='B'
-[2024-08-03 15:14:56] [Rank 0] totoal_tokens=11580, outputs='A'
-[2024-08-03 15:14:56] [Rank 3] totoal_tokens=11860, outputs='A'
-[2024-08-03 15:14:56] [Rank 2] totoal_tokens=12164, outputs='A'
-[2024-08-03 15:14:56] [Rank 1] totoal_tokens=11770, outputs='B'
-[2024-08-03 15:14:56] [Rank 0] totoal_tokens=11605, outputs='A'
-ssing InternVL2-2B_reasoning-image-test.jsonl:  39%|███▉      | 289/734 [01:35<05:05,  1.45it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  40%|███▉      | 290/734 [01:35<04:41,  1.58it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  40%|███▉      | 291/734 [01:36<05:43,  1.29it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  40%|███▉      | 292/734 [01:37<05:53,  1.25it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  40%|███▉      | 293/734 [01:38<05:35,  1.31it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  40%|████      | 294/734 [01:38<05:02,  1.45it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  40%|████      | 295/734 [01:39<04:43,  1.55it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  40%|████      | 296/734 [01:40<04:40,  1.56it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  40%|████      | 297/734 [01:40<04:43,  1.54it/s]Processing InternVL2-2B_reasoning-image[2024-08-03 15:14:57] [Rank 2] totoal_tokens=12172, outputs='B'
-[2024-08-03 15:14:57] [Rank 3] totoal_tokens=11905, outputs='A'
-[2024-08-03 15:14:57] [Rank 1] totoal_tokens=11770, outputs='B'
-[2024-08-03 15:14:57] [Rank 0] totoal_tokens=11807, outputs='B'
-[2024-08-03 15:14:57] [Rank 2] totoal_tokens=12181, outputs='B'
-[2024-08-03 15:14:57] [Rank 3] totoal_tokens=11955, outputs='B'
-[2024-08-03 15:14:57] [Rank 1] totoal_tokens=11928, outputs='A'
-[2024-08-03 15:14:58] [Rank 0] totoal_tokens=11962, outputs='A'
-[2024-08-03 15:14:58] [Rank 3] totoal_tokens=11962, outputs='B'
-[2024-08-03 15:14:58] [Rank 2] totoal_tokens=12272, outputs='A'
-[2024-08-03 15:14:58] [Rank 1] totoal_tokens=11930, outputs='A'
-[2024-08-03 15:14:58] [Rank 0] totoal_tokens=12139, outputs='A'
-[2024-08-03 15:14:59] [Rank 3] totoal_tokens=11991, outputs='A'
-[2024-08-03 15:14:59] [Rank 2] totoal_tokens=12345, outputs='A'
-[2024-08-03 15:14:59] [Rank 1] totoal_tokens=11967, outputs='A'
-[2024-08-03 15:14:59] [Rank 0] totoal_tokens=12141, outputs='B'
-[2024-08-03 15:14:59] [Rank 3] totoal_tokens=12141, outputs='B'
-[2024-08-03 15:15:00] [Rank 2] totoal_tokens=12483, outputs='A'
-[2024-08-03 15:15:00] [Rank 1] totoal_tokens=11986, outputs='A'
-[2024-08-03 15:15:00] [Rank 0] totoal_tokens=12185, outputs='B'
-[2024-08-03 15:15:00] [Rank 3] totoal_tokens=12197, outputs='A'
-[2024-08-03 15:15:00] [Rank 1] totoal_tokens=12005, outputs='B'
-[2024-08-03 15:15:00] [Rank 0] totoal_tokens=12293, outputs='B'
-[2024-08-03 15:15:00] [Rank 2] totoal_tokens=12500, outputs='A'
-[2024-08-03 15:15:01] [Rank 3] totoal_tokens=12247, outputs='A'
-[2024-08-03 15:15:01] [Rank 0] totoal_tokens=12302, outputs='B'
-[2024-08-03 15:15:01] [Rank 2] totoal_tokens=12531, outputs='B'
-[2024-08-03 15:15:01] [Rank 1] totoal_tokens=12202, outputs='B'
-[2024-08-03 15:15:01] [Rank 3] totoal_tokens=12370, outputs='A'
-[2024-08-03 15:15:02] [Rank 0] totoal_tokens=12435, outputs='B'
-[2024-08-03 15:15:02] [Rank 1] totoal_tokens=12326, outputs='A'
-[2024-08-03 15:15:02] [Rank 2] totoal_tokens=12626, outputs='A'
-[2024-08-03 15:15:02] [Rank 3] totoal_tokens=12424, outputs='B'
-[2024-08-03 15:15:02] [Rank 0] totoal_tokens=12443, outputs='B'
--test.jsonl:  41%|████      | 298/734 [01:41<04:32,  1.60it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  41%|████      | 299/734 [01:41<04:13,  1.71it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  41%|████      | 300/734 [01:42<04:56,  1.46it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  41%|████      | 301/734 [01:43<04:44,  1.52it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  41%|████      | 302/734 [01:43<04:30,  1.60it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  41%|████▏     | 303/734 [01:44<04:20,  1.65it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  41%|████▏     | 304/734 [01:45<04:39,  1.54it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  42%|████▏     | 305/734 [01:45<04:36,  1.55it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  42%|████▏     | 306/734 [01:46<04:30,  1.58it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  42%|██�[2024-08-03 15:15:02] [Rank 1] totoal_tokens=12356, outputs='B'
-[2024-08-03 15:15:02] [Rank 2] totoal_tokens=12639, outputs='B'
-[2024-08-03 15:15:03] [Rank 3] totoal_tokens=12435, outputs='B'
-[2024-08-03 15:15:03] [Rank 1] totoal_tokens=12414, outputs='A'
-[2024-08-03 15:15:03] [Rank 0] totoal_tokens=12582, outputs='A'
-[2024-08-03 15:15:03] [Rank 2] totoal_tokens=12683, outputs='A'
-[2024-08-03 15:15:03] [Rank 3] totoal_tokens=12454, outputs='A'
-[2024-08-03 15:15:04] [Rank 2] totoal_tokens=12700, outputs='A'
-[2024-08-03 15:15:04] [Rank 0] totoal_tokens=12650, outputs='A'
-[2024-08-03 15:15:04] [Rank 3] totoal_tokens=12484, outputs='A'
-[2024-08-03 15:15:04] [Rank 1] totoal_tokens=12551, outputs='A'
-[2024-08-03 15:15:04] [Rank 2] totoal_tokens=12730, outputs='A'
-[2024-08-03 15:15:04] [Rank 0] totoal_tokens=12687, outputs='A'
-[2024-08-03 15:15:05] [Rank 3] totoal_tokens=12508, outputs='A'
-[2024-08-03 15:15:05] [Rank 1] totoal_tokens=12567, outputs='A'
-[2024-08-03 15:15:05] [Rank 0] totoal_tokens=12700, outputs='A'
-[2024-08-03 15:15:05] [Rank 2] totoal_tokens=12732, outputs='A'
-[2024-08-03 15:15:05] [Rank 3] totoal_tokens=12520, outputs='B'
-[2024-08-03 15:15:06] [Rank 1] totoal_tokens=12578, outputs='A'
-[2024-08-03 15:15:06] [Rank 3] totoal_tokens=12524, outputs='B'
-[2024-08-03 15:15:06] [Rank 0] totoal_tokens=12765, outputs='A'
-[2024-08-03 15:15:06] [Rank 2] totoal_tokens=12887, outputs='A'
-[2024-08-03 15:15:06] [Rank 1] totoal_tokens=12626, outputs='A'
-[2024-08-03 15:15:06] [Rank 0] totoal_tokens=13011, outputs='B'
-[2024-08-03 15:15:06] [Rank 3] totoal_tokens=12587, outputs='A'
-[2024-08-03 15:15:07] [Rank 2] totoal_tokens=12943, outputs='A'
-[2024-08-03 15:15:07] [Rank 1] totoal_tokens=12689, outputs='A'
-[2024-08-03 15:15:07] [Rank 3] totoal_tokens=12688, outputs='B'
-[2024-08-03 15:15:07] [Rank 0] totoal_tokens=13055, outputs='B'
-[2024-08-03 15:15:07] [Rank 2] totoal_tokens=12954, outputs='B'
-[2024-08-03 15:15:08] [Rank 1] totoal_tokens=13083, outputs='B'
-[2024-08-03 15:15:08] [Rank 3] totoal_tokens=12732, outputs='A'
-[2024-08-03 15:15:08] [Rank 2] totoal_tokens=12955, outputs='A'
-[2024-08-03 15:15:08] [Rank 1] totoal_tokens=13114, outputs='B'
-[2024-08-03 15:15:08] [Rank 0] totoal_tokens=13135, outputs='B'
-[2024-08-03 15:15:09] [Rank 3] totoal_tokens=12741, outputs='B'
-[2024-08-03 15:15:09] [Rank 2] totoal_tokens=12964, outputs='A'
-[2024-08-03 15:15:09] [Rank 1] totoal_tokens=13183, outputs='B'
-[2024-08-03 15:15:09] [Rank 3] totoal_tokens=12745, outputs='B'
-[2024-08-03 15:15:09] [Rank 0] totoal_tokens=13235, outputs='B'
-�█▏     | 307/734 [01:47<04:21,  1.64it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  42%|████▏     | 308/734 [01:47<04:56,  1.44it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  42%|████▏     | 309/734 [01:48<04:55,  1.44it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  42%|████▏     | 310/734 [01:49<04:53,  1.45it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  42%|████▏     | 311/734 [01:50<04:52,  1.45it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  43%|████▎     | 312/734 [01:50<04:57,  1.42it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  43%|████▎     | 313/734 [01:51<04:47,  1.46it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  43%|████▎     | 314/734 [01:52<04:56,  1.42it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  43%|████▎     | 315/734 [01:53<06:06,  1.14it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  43%|████▎     | 31[2024-08-03 15:15:10] [Rank 2] totoal_tokens=12973, outputs='A'
-[2024-08-03 15:15:10] [Rank 1] totoal_tokens=13207, outputs='B'
-[2024-08-03 15:15:10] [Rank 3] totoal_tokens=12885, outputs='A'
-[2024-08-03 15:15:10] [Rank 0] totoal_tokens=13321, outputs='A'
-[2024-08-03 15:15:10] [Rank 1] totoal_tokens=13259, outputs='B'
-[2024-08-03 15:15:10] [Rank 2] totoal_tokens=12979, outputs='B'
-[2024-08-03 15:15:10] [Rank 0] totoal_tokens=13363, outputs='B'
-[2024-08-03 15:15:11] [Rank 3] totoal_tokens=12887, outputs='A'
-[2024-08-03 15:15:11] [Rank 1] totoal_tokens=13275, outputs='B'
-[2024-08-03 15:15:11] [Rank 2] totoal_tokens=12999, outputs='B'
-[2024-08-03 15:15:11] [Rank 3] totoal_tokens=12990, outputs='B'
-[2024-08-03 15:15:11] [Rank 0] totoal_tokens=13365, outputs='A'
-[2024-08-03 15:15:11] [Rank 1] totoal_tokens=13299, outputs='B'
-[2024-08-03 15:15:12] [Rank 2] totoal_tokens=13011, outputs='B'
-[2024-08-03 15:15:12] [Rank 3] totoal_tokens=13227, outputs='B'
-[2024-08-03 15:15:12] [Rank 0] totoal_tokens=13398, outputs='B'
-[2024-08-03 15:15:12] [Rank 1] totoal_tokens=13307, outputs='B'
-[2024-08-03 15:15:12] [Rank 3] totoal_tokens=13233, outputs='B'
-[2024-08-03 15:15:13] [Rank 0] totoal_tokens=13403, outputs='B'
-[2024-08-03 15:15:13] [Rank 1] totoal_tokens=13346, outputs='B'
-[2024-08-03 15:15:13] [Rank 2] totoal_tokens=13135, outputs='B'
-[2024-08-03 15:15:13] [Rank 3] totoal_tokens=13285, outputs='A'
-[2024-08-03 15:15:13] [Rank 0] totoal_tokens=13437, outputs='A'
-[2024-08-03 15:15:13] [Rank 1] totoal_tokens=13355, outputs='A'
-[2024-08-03 15:15:13] [Rank 2] totoal_tokens=13378, outputs='A'
-[2024-08-03 15:15:14] [Rank 3] totoal_tokens=13363, outputs='B'
-[2024-08-03 15:15:14] [Rank 0] totoal_tokens=13452, outputs='A'
-[2024-08-03 15:15:14] [Rank 1] totoal_tokens=13357, outputs='A'
-[2024-08-03 15:15:14] [Rank 3] totoal_tokens=13370, outputs='B'
-[2024-08-03 15:15:14] [Rank 2] totoal_tokens=13481, outputs='A'
-[2024-08-03 15:15:15] [Rank 0] totoal_tokens=13452, outputs='A'
-[2024-08-03 15:15:15] [Rank 1] totoal_tokens=13369, outputs='A'
-[2024-08-03 15:15:15] [Rank 3] totoal_tokens=13426, outputs='A'
-[2024-08-03 15:15:15] [Rank 2] totoal_tokens=13633, outputs='A'
-[2024-08-03 15:15:15] [Rank 0] totoal_tokens=13588, outputs='B'
-6/734 [01:54<05:37,  1.24it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  43%|████▎     | 317/734 [01:54<05:30,  1.26it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  43%|████▎     | 318/734 [01:55<05:01,  1.38it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  43%|████▎     | 319/734 [01:56<05:12,  1.33it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  44%|████▎     | 320/734 [01:56<04:57,  1.39it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  44%|████▎     | 321/734 [01:57<04:50,  1.42it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  44%|████▍     | 322/734 [01:58<05:00,  1.37it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  44%|████▍     | 323/734 [01:59<04:57,  1.38it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  44%|████▍     | 324/734 [01:59<04:51,  1.41it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  44%|████▍     | 325/734 [02:00<04:[2024-08-03 15:15:16] [Rank 1] totoal_tokens=13398, outputs='B'
-[2024-08-03 15:15:16] [Rank 3] totoal_tokens=13476, outputs='A'
-[2024-08-03 15:15:16] [Rank 2] totoal_tokens=13650, outputs='B'
-[2024-08-03 15:15:16] [Rank 0] totoal_tokens=13618, outputs='A'
-[2024-08-03 15:15:16] [Rank 1] totoal_tokens=13421, outputs='B'
-[2024-08-03 15:15:16] [Rank 3] totoal_tokens=13508, outputs='A'
-[2024-08-03 15:15:17] [Rank 0] totoal_tokens=13663, outputs='B'
-[2024-08-03 15:15:17] [Rank 2] totoal_tokens=13651, outputs='A'
-[2024-08-03 15:15:17] [Rank 1] totoal_tokens=13682, outputs='B'
-[2024-08-03 15:15:17] [Rank 3] totoal_tokens=13562, outputs='A'
-[2024-08-03 15:15:17] [Rank 2] totoal_tokens=13662, outputs='B'
-[2024-08-03 15:15:18] [Rank 1] totoal_tokens=13745, outputs='B'
-[2024-08-03 15:15:18] [Rank 0] totoal_tokens=13666, outputs='A'
-[2024-08-03 15:15:18] [Rank 3] totoal_tokens=13601, outputs='A'
-[2024-08-03 15:15:18] [Rank 2] totoal_tokens=13674, outputs='A'
-[2024-08-03 15:15:18] [Rank 1] totoal_tokens=13856, outputs='A'
-[2024-08-03 15:15:19] [Rank 0] totoal_tokens=13701, outputs='A'
-[2024-08-03 15:15:19] [Rank 3] totoal_tokens=13606, outputs='A'
-[2024-08-03 15:15:19] [Rank 2] totoal_tokens=13720, outputs='B'
-[2024-08-03 15:15:19] [Rank 1] totoal_tokens=13881, outputs='A'
-[2024-08-03 15:15:19] [Rank 0] totoal_tokens=13706, outputs='B'
-[2024-08-03 15:15:19] [Rank 2] totoal_tokens=13757, outputs='B'
-[2024-08-03 15:15:20] [Rank 3] totoal_tokens=13618, outputs='A'
-[2024-08-03 15:15:20] [Rank 0] totoal_tokens=13712, outputs='B'
-[2024-08-03 15:15:20] [Rank 1] totoal_tokens=13935, outputs='A'
-[2024-08-03 15:15:20] [Rank 3] totoal_tokens=13639, outputs='B'
-[2024-08-03 15:15:20] [Rank 2] totoal_tokens=13851, outputs='A'
-[2024-08-03 15:15:21] [Rank 0] totoal_tokens=13745, outputs='B'
-[2024-08-03 15:15:21] [Rank 1] totoal_tokens=14070, outputs='B'
-[2024-08-03 15:15:21] [Rank 3] totoal_tokens=13662, outputs='A'
-[2024-08-03 15:15:21] [Rank 2] totoal_tokens=13855, outputs='A'
-[2024-08-03 15:15:21] [Rank 0] totoal_tokens=13850, outputs='A'
-[2024-08-03 15:15:21] [Rank 1] totoal_tokens=14103, outputs='B'
-[2024-08-03 15:15:22] [Rank 3] totoal_tokens=13662, outputs='B'
-[2024-08-03 15:15:22] [Rank 2] totoal_tokens=13979, outputs='A'
-[2024-08-03 15:15:22] [Rank 1] totoal_tokens=14133, outputs='A'
-[2024-08-03 15:15:22] [Rank 0] totoal_tokens=13927, outputs='A'
-[2024-08-03 15:15:23] [Rank 3] totoal_tokens=14070, outputs='B'
-[2024-08-03 15:15:23] [Rank 2] totoal_tokens=14033, outputs='A'
-[2024-08-03 15:15:23] [Rank 1] totoal_tokens=14278, outputs='B'
-[2024-08-03 15:15:23] [Rank 0] totoal_tokens=14050, outputs='B'
-43,  1.44it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  44%|████▍     | 326/734 [02:01<04:45,  1.43it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  45%|████▍     | 327/734 [02:01<04:33,  1.49it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  45%|████▍     | 328/734 [02:02<05:20,  1.27it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  45%|████▍     | 329/734 [02:03<05:21,  1.26it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  45%|████▍     | 330/734 [02:04<05:03,  1.33it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  45%|████▌     | 331/734 [02:04<04:45,  1.41it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  45%|████▌     | 332/734 [02:05<04:45,  1.41it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  45%|████▌     | 333/734 [02:06<04:43,  1.41it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  46%|████▌     | 334/734 [02:07<05:45,  1.16it/s]P[2024-08-03 15:15:24] [Rank 1] totoal_tokens=14398, outputs='B'
-[2024-08-03 15:15:24] [Rank 0] totoal_tokens=14089, outputs='B'
-[2024-08-03 15:15:24] [Rank 3] totoal_tokens=14100, outputs='B'
-[2024-08-03 15:15:24] [Rank 2] totoal_tokens=14100, outputs='B'
-[2024-08-03 15:15:24] [Rank 1] totoal_tokens=14398, outputs='B'
-[2024-08-03 15:15:25] [Rank 0] totoal_tokens=14089, outputs='A'
-[2024-08-03 15:15:25] [Rank 3] totoal_tokens=14121, outputs='A'
-[2024-08-03 15:15:25] [Rank 1] totoal_tokens=14462, outputs='B'
-[2024-08-03 15:15:25] [Rank 0] totoal_tokens=14133, outputs='A'
-[2024-08-03 15:15:25] [Rank 2] totoal_tokens=14113, outputs='B'
-[2024-08-03 15:15:26] [Rank 3] totoal_tokens=14198, outputs='B'
-[2024-08-03 15:15:26] [Rank 1] totoal_tokens=14619, outputs='B'
-[2024-08-03 15:15:26] [Rank 0] totoal_tokens=14213, outputs='B'
-[2024-08-03 15:15:26] [Rank 2] totoal_tokens=14133, outputs='A'
-[2024-08-03 15:15:26] [Rank 3] totoal_tokens=14252, outputs='B'
-[2024-08-03 15:15:27] [Rank 0] totoal_tokens=14247, outputs='B'
-[2024-08-03 15:15:27] [Rank 1] totoal_tokens=14624, outputs='A'
-[2024-08-03 15:15:27] [Rank 2] totoal_tokens=14324, outputs='A'
-[2024-08-03 15:15:27] [Rank 3] totoal_tokens=14267, outputs='A'
-[2024-08-03 15:15:27] [Rank 0] totoal_tokens=14352, outputs='B'
-[2024-08-03 15:15:28] [Rank 1] totoal_tokens=14785, outputs='A'
-[2024-08-03 15:15:28] [Rank 2] totoal_tokens=14461, outputs='A'
-[2024-08-03 15:15:28] [Rank 0] totoal_tokens=14365, outputs='B'
-[2024-08-03 15:15:28] [Rank 3] totoal_tokens=14363, outputs='A'
-[2024-08-03 15:15:28] [Rank 1] totoal_tokens=15063, outputs='B'
-[2024-08-03 15:15:28] [Rank 2] totoal_tokens=14526, outputs='B'
-[2024-08-03 15:15:29] [Rank 0] totoal_tokens=14375, outputs='A'
-[2024-08-03 15:15:29] [Rank 3] totoal_tokens=14430, outputs='B'
-[2024-08-03 15:15:29] [Rank 1] totoal_tokens=15147, outputs='B'
-[2024-08-03 15:15:29] [Rank 2] totoal_tokens=14620, outputs='A'
-[2024-08-03 15:15:29] [Rank 0] totoal_tokens=14428, outputs='B'
-rocessing InternVL2-2B_reasoning-image-test.jsonl:  46%|████▌     | 335/734 [02:08<05:23,  1.24it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  46%|████▌     | 336/734 [02:08<04:58,  1.33it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  46%|████▌     | 337/734 [02:09<04:57,  1.33it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  46%|████▌     | 338/734 [02:10<04:54,  1.34it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  46%|████▌     | 339/734 [02:10<04:50,  1.36it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  46%|████▋     | 340/734 [02:11<04:39,  1.41it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  46%|████▋     | 341/734 [02:12<04:35,  1.43it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  47%|████▋     | 342/734 [02:12<04:28,  1.46it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  47%|████▋     | 343/734 [02:13<04:39,  1.40it/s]Processing Intern[2024-08-03 15:15:29] [Rank 3] totoal_tokens=14508, outputs='B'
-[2024-08-03 15:15:30] [Rank 1] totoal_tokens=15204, outputs='B'
-[2024-08-03 15:15:30] [Rank 2] totoal_tokens=14753, outputs='B'
-[2024-08-03 15:15:30] [Rank 0] totoal_tokens=14430, outputs='B'
-[2024-08-03 15:15:30] [Rank 1] totoal_tokens=15213, outputs='B'
-[2024-08-03 15:15:30] [Rank 3] totoal_tokens=14707, outputs='A'
-[2024-08-03 15:15:31] [Rank 0] totoal_tokens=14478, outputs='B'
-[2024-08-03 15:15:31] [Rank 2] totoal_tokens=14775, outputs='A'
-[2024-08-03 15:15:31] [Rank 3] totoal_tokens=14775, outputs='A'
-[2024-08-03 15:15:31] [Rank 1] totoal_tokens=15269, outputs='A'
-[2024-08-03 15:15:32] [Rank 0] totoal_tokens=15055, outputs='A'
-[2024-08-03 15:15:32] [Rank 2] totoal_tokens=14924, outputs='B'
-[2024-08-03 15:15:32] [Rank 1] totoal_tokens=15310, outputs='B'
-[2024-08-03 15:15:32] [Rank 3] totoal_tokens=14775, outputs='A'
-[2024-08-03 15:15:33] [Rank 0] totoal_tokens=15235, outputs='A'
-[2024-08-03 15:15:33] [Rank 2] totoal_tokens=14959, outputs='A'
-[2024-08-03 15:15:33] [Rank 1] totoal_tokens=15340, outputs='B'
-[2024-08-03 15:15:33] [Rank 3] totoal_tokens=14808, outputs='A'
-[2024-08-03 15:15:33] [Rank 0] totoal_tokens=15487, outputs='A'
-[2024-08-03 15:15:33] [Rank 2] totoal_tokens=14963, outputs='A'
-[2024-08-03 15:15:34] [Rank 1] totoal_tokens=15517, outputs='B'
-[2024-08-03 15:15:34] [Rank 3] totoal_tokens=14864, outputs='A'
-[2024-08-03 15:15:34] [Rank 2] totoal_tokens=15154, outputs='B'
-[2024-08-03 15:15:34] [Rank 0] totoal_tokens=15535, outputs='A'
-[2024-08-03 15:15:34] [Rank 1] totoal_tokens=15585, outputs='A'
-[2024-08-03 15:15:35] [Rank 3] totoal_tokens=14894, outputs='A'
-[2024-08-03 15:15:35] [Rank 2] totoal_tokens=15243, outputs='B'
-[2024-08-03 15:15:35] [Rank 0] totoal_tokens=15558, outputs='B'
-[2024-08-03 15:15:36] [Rank 3] totoal_tokens=14913, outputs='B'
-[2024-08-03 15:15:36] [Rank 1] totoal_tokens=15680, outputs='B'
-[2024-08-03 15:15:36] [Rank 2] totoal_tokens=15243, outputs='B'
-[2024-08-03 15:15:36] [Rank 0] totoal_tokens=15585, outputs='A'
-[2024-08-03 15:15:36] [Rank 3] totoal_tokens=15692, outputs='A'
-[2024-08-03 15:15:37] [Rank 2] totoal_tokens=15384, outputs='B'
-[2024-08-03 15:15:37] [Rank 1] totoal_tokens=15782, outputs='A'
-[2024-08-03 15:15:37] [Rank 0] totoal_tokens=15709, outputs='A'
-VL2-2B_reasoning-image-test.jsonl:  47%|████▋     | 344/734 [02:14<04:33,  1.42it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  47%|████▋     | 345/734 [02:15<04:46,  1.36it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  47%|████▋     | 346/734 [02:15<04:36,  1.41it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  47%|████▋     | 347/734 [02:16<04:43,  1.37it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  47%|████▋     | 348/734 [02:17<04:59,  1.29it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  48%|████▊     | 349/734 [02:18<05:01,  1.28it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  48%|████▊     | 350/734 [02:19<05:24,  1.18it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  48%|████▊     | 351/734 [02:20<05:13,  1.22it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  48%|████▊     | 352/734 [02:20<05:07,  1.24it/s]Processing InternVL2-2B_reasoning[2024-08-03 15:15:37] [Rank 3] totoal_tokens=15794, outputs='A'
-[2024-08-03 15:15:37] [Rank 1] totoal_tokens=15782, outputs='A'
-[2024-08-03 15:15:38] [Rank 0] totoal_tokens=15719, outputs='A'
-[2024-08-03 15:15:38] [Rank 3] totoal_tokens=15883, outputs='A'
-[2024-08-03 15:15:39] [Rank 0] totoal_tokens=15899, outputs='A'
-[2024-08-03 15:15:39] [Rank 2] totoal_tokens=15477, outputs='A'
-[2024-08-03 15:15:39] [Rank 3] totoal_tokens=15940, outputs='A'
-[2024-08-03 15:15:39] [Rank 1] totoal_tokens=15866, outputs='A'
-[2024-08-03 15:15:40] [Rank 2] totoal_tokens=15508, outputs='A'
-[2024-08-03 15:15:40] [Rank 3] totoal_tokens=16010, outputs='A'
-[2024-08-03 15:15:40] [Rank 0] totoal_tokens=15909, outputs='A'
-[2024-08-03 15:15:40] [Rank 2] totoal_tokens=15558, outputs='A'
-[2024-08-03 15:15:40] [Rank 1] totoal_tokens=15866, outputs='A'
-[2024-08-03 15:15:41] [Rank 3] totoal_tokens=16196, outputs='A'
-[2024-08-03 15:15:41] [Rank 0] totoal_tokens=16157, outputs='B'
-[2024-08-03 15:15:41] [Rank 2] totoal_tokens=15628, outputs='B'
-[2024-08-03 15:15:41] [Rank 1] totoal_tokens=16088, outputs='A'
-[2024-08-03 15:15:42] [Rank 3] totoal_tokens=16216, outputs='B'
-[2024-08-03 15:15:42] [Rank 2] totoal_tokens=15932, outputs='B'
-[2024-08-03 15:15:42] [Rank 0] totoal_tokens=16436, outputs='B'
-[2024-08-03 15:15:42] [Rank 3] totoal_tokens=16408, outputs='A'
-[2024-08-03 15:15:43] [Rank 2] totoal_tokens=15945, outputs='B'
-[2024-08-03 15:15:43] [Rank 1] totoal_tokens=16103, outputs='A'
-[2024-08-03 15:15:43] [Rank 0] totoal_tokens=16436, outputs='B'
-[2024-08-03 15:15:43] [Rank 2] totoal_tokens=15957, outputs='A'
-[2024-08-03 15:15:44] [Rank 3] totoal_tokens=16411, outputs='A'
-[2024-08-03 15:15:44] [Rank 1] totoal_tokens=16216, outputs='A'
-[2024-08-03 15:15:44] [Rank 0] totoal_tokens=16447, outputs='A'
-[2024-08-03 15:15:44] [Rank 2] totoal_tokens=16057, outputs='B'
-[2024-08-03 15:15:44] [Rank 1] totoal_tokens=16239, outputs='B'
-[2024-08-03 15:15:44] [Rank 3] totoal_tokens=16444, outputs='B'
-[2024-08-03 15:15:45] [Rank 0] totoal_tokens=16635, outputs='A'
-[2024-08-03 15:15:45] [Rank 1] totoal_tokens=16307, outputs='B'
-[2024-08-03 15:15:45] [Rank 3] totoal_tokens=16481, outputs='A'
-[2024-08-03 15:15:46] [Rank 2] totoal_tokens=16079, outputs='A'
-[2024-08-03 15:15:46] [Rank 0] totoal_tokens=16793, outputs='A'
--image-test.jsonl:  48%|████▊     | 353/734 [02:21<05:27,  1.16it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  48%|████▊     | 354/734 [02:22<05:26,  1.16it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  48%|████▊     | 355/734 [02:23<05:36,  1.13it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  49%|████▊     | 356/734 [02:25<06:39,  1.06s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  49%|████▊     | 357/734 [02:25<06:08,  1.02it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  49%|████▉     | 358/734 [02:26<06:09,  1.02it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  49%|████▉     | 359/734 [02:27<06:09,  1.01it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  49%|████▉     | 360/734 [02:28<05:54,  1.06it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  49%|████▉     | 361/734 [02:29<05:41,  1.09it/s]Processing InternVL2-2B_reasoning-image-test.json[2024-08-03 15:15:46] [Rank 1] totoal_tokens=16385, outputs='B'
-[2024-08-03 15:15:46] [Rank 3] totoal_tokens=16489, outputs='B'
-[2024-08-03 15:15:46] [Rank 2] totoal_tokens=16214, outputs='B'
-[2024-08-03 15:15:46] [Rank 0] totoal_tokens=16797, outputs='B'
-[2024-08-03 15:15:47] [Rank 1] totoal_tokens=16447, outputs='A'
-[2024-08-03 15:15:47] [Rank 3] totoal_tokens=16528, outputs='A'
-[2024-08-03 15:15:47] [Rank 2] totoal_tokens=16251, outputs='B'
-[2024-08-03 15:15:47] [Rank 0] totoal_tokens=16951, outputs='B'
-[2024-08-03 15:15:48] [Rank 1] totoal_tokens=16527, outputs='A'
-[2024-08-03 15:15:48] [Rank 2] totoal_tokens=16287, outputs='B'
-[2024-08-03 15:15:48] [Rank 0] totoal_tokens=17294, outputs='A'
-[2024-08-03 15:15:49] [Rank 1] totoal_tokens=16617, outputs='B'
-[2024-08-03 15:15:49] [Rank 3] totoal_tokens=16726, outputs='A'
-[2024-08-03 15:15:49] [Rank 2] totoal_tokens=16334, outputs='B'
-[2024-08-03 15:15:49] [Rank 0] totoal_tokens=17471, outputs='A'
-[2024-08-03 15:15:49] [Rank 1] totoal_tokens=16674, outputs='B'
-[2024-08-03 15:15:50] [Rank 2] totoal_tokens=16510, outputs='B'
-[2024-08-03 15:15:50] [Rank 3] totoal_tokens=16741, outputs='A'
-[2024-08-03 15:15:50] [Rank 0] totoal_tokens=17509, outputs='B'
-[2024-08-03 15:15:50] [Rank 3] totoal_tokens=16784, outputs='A'
-[2024-08-03 15:15:51] [Rank 1] totoal_tokens=16697, outputs='B'
-[2024-08-03 15:15:51] [Rank 2] totoal_tokens=16781, outputs='A'
-[2024-08-03 15:15:51] [Rank 0] totoal_tokens=17531, outputs='A'
-[2024-08-03 15:15:51] [Rank 1] totoal_tokens=16757, outputs='B'
-[2024-08-03 15:15:51] [Rank 3] totoal_tokens=16971, outputs='A'
-[2024-08-03 15:15:52] [Rank 2] totoal_tokens=16796, outputs='B'
-[2024-08-03 15:15:52] [Rank 0] totoal_tokens=17642, outputs='A'
-[2024-08-03 15:15:52] [Rank 1] totoal_tokens=16829, outputs='B'
-[2024-08-03 15:15:52] [Rank 3] totoal_tokens=17197, outputs='B'
-[2024-08-03 15:15:53] [Rank 2] totoal_tokens=16837, outputs='B'
-[2024-08-03 15:15:53] [Rank 1] totoal_tokens=16833, outputs='B'
-[2024-08-03 15:15:53] [Rank 0] totoal_tokens=17754, outputs='B'
-[2024-08-03 15:15:53] [Rank 3] totoal_tokens=17254, outputs='B'
-[2024-08-03 15:15:54] [Rank 2] totoal_tokens=16865, outputs='A'
-[2024-08-03 15:15:54] [Rank 1] totoal_tokens=16859, outputs='A'
-[2024-08-03 15:15:54] [Rank 3] totoal_tokens=17353, outputs='B'
-[2024-08-03 15:15:54] [Rank 0] totoal_tokens=17766, outputs='A'
-l:  49%|████▉     | 362/734 [02:30<06:03,  1.02it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  49%|████▉     | 363/734 [02:31<05:41,  1.09it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  50%|████▉     | 364/734 [02:32<05:25,  1.14it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  50%|████▉     | 365/734 [02:33<05:32,  1.11it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  50%|████▉     | 366/734 [02:34<05:38,  1.09it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  50%|█████     | 367/734 [02:35<05:34,  1.10it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  50%|█████     | 368/734 [02:35<05:39,  1.08it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  50%|█████     | 369/734 [02:37<05:57,  1.02it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  50%|█████     | 370/734 [02:38<06:00,  1.01it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  51%|██�[2024-08-03 15:15:55] [Rank 2] totoal_tokens=16965, outputs='A'
-[2024-08-03 15:15:55] [Rank 1] totoal_tokens=16881, outputs='A'
-[2024-08-03 15:15:55] [Rank 3] totoal_tokens=17447, outputs='A'
-[2024-08-03 15:15:56] [Rank 2] totoal_tokens=17047, outputs='B'
-[2024-08-03 15:15:56] [Rank 0] totoal_tokens=17772, outputs='A'
-[2024-08-03 15:15:56] [Rank 1] totoal_tokens=16959, outputs='B'
-[2024-08-03 15:15:56] [Rank 3] totoal_tokens=17548, outputs='B'
-[2024-08-03 15:15:57] [Rank 1] totoal_tokens=16965, outputs='A'
-[2024-08-03 15:15:57] [Rank 0] totoal_tokens=17854, outputs='A'
-[2024-08-03 15:15:57] [Rank 2] totoal_tokens=17169, outputs='A'
-[2024-08-03 15:15:57] [Rank 3] totoal_tokens=17682, outputs='A'
-[2024-08-03 15:15:58] [Rank 2] totoal_tokens=17197, outputs='B'
-[2024-08-03 15:15:58] [Rank 1] totoal_tokens=17082, outputs='A'
-[2024-08-03 15:15:58] [Rank 0] totoal_tokens=17861, outputs='A'
-[2024-08-03 15:15:58] [Rank 3] totoal_tokens=17697, outputs='B'
-[2024-08-03 15:15:58] [Rank 1] totoal_tokens=17133, outputs='B'
-[2024-08-03 15:15:59] [Rank 2] totoal_tokens=17229, outputs='B'
-[2024-08-03 15:15:59] [Rank 0] totoal_tokens=18039, outputs='A'
-[2024-08-03 15:16:00] [Rank 3] totoal_tokens=17738, outputs='A'
-[2024-08-03 15:16:00] [Rank 2] totoal_tokens=17254, outputs='B'
-[2024-08-03 15:16:00] [Rank 0] totoal_tokens=18079, outputs='A'
-[2024-08-03 15:16:00] [Rank 1] totoal_tokens=17359, outputs='A'
-[2024-08-03 15:16:01] [Rank 3] totoal_tokens=17843, outputs='A'
-[2024-08-03 15:16:01] [Rank 2] totoal_tokens=17472, outputs='B'
-[2024-08-03 15:16:01] [Rank 1] totoal_tokens=17446, outputs='A'
-[2024-08-03 15:16:01] [Rank 0] totoal_tokens=18133, outputs='B'
-[2024-08-03 15:16:02] [Rank 3] totoal_tokens=17937, outputs='B'
-[2024-08-03 15:16:02] [Rank 2] totoal_tokens=17577, outputs='A'
-[2024-08-03 15:16:02] [Rank 1] totoal_tokens=17447, outputs='A'
-[2024-08-03 15:16:02] [Rank 0] totoal_tokens=18143, outputs='B'
-[2024-08-03 15:16:03] [Rank 3] totoal_tokens=18079, outputs='A'
-[2024-08-03 15:16:03] [Rank 0] totoal_tokens=18154, outputs='B'
-[2024-08-03 15:16:03] [Rank 2] totoal_tokens=17672, outputs='A'
-[2024-08-03 15:16:04] [Rank 3] totoal_tokens=18087, outputs='A'
-[2024-08-03 15:16:04] [Rank 0] totoal_tokens=18178, outputs='B'
-�██     | 371/734 [02:39<06:29,  1.07s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  51%|█████     | 372/734 [02:40<06:37,  1.10s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  51%|█████     | 373/734 [02:41<06:29,  1.08s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  51%|█████     | 374/734 [02:42<06:23,  1.06s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  51%|█████     | 375/734 [02:43<06:17,  1.05s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  51%|█████     | 376/734 [02:44<06:22,  1.07s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  51%|█████▏    | 377/734 [02:46<06:53,  1.16s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  51%|█████▏    | 378/734 [02:46<06:21,  1.07s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  52%|█████▏    | 379/734 [02:47<05:54,  1.00it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  52%|█████▏[2024-08-03 15:16:04] [Rank 2] totoal_tokens=17673, outputs='A'
-[2024-08-03 15:16:04] [Rank 1] totoal_tokens=17596, outputs='A'
-[2024-08-03 15:16:04] [Rank 3] totoal_tokens=18151, outputs='B'
-[2024-08-03 15:16:05] [Rank 0] totoal_tokens=18253, outputs='B'
-[2024-08-03 15:16:05] [Rank 2] totoal_tokens=17698, outputs='B'
-[2024-08-03 15:16:05] [Rank 1] totoal_tokens=17640, outputs='A'
-[2024-08-03 15:16:06] [Rank 3] totoal_tokens=18157, outputs='A'
-[2024-08-03 15:16:06] [Rank 0] totoal_tokens=18294, outputs='A'
-[2024-08-03 15:16:06] [Rank 2] totoal_tokens=17754, outputs='B'
-[2024-08-03 15:16:07] [Rank 1] totoal_tokens=17681, outputs='B'
-[2024-08-03 15:16:07] [Rank 3] totoal_tokens=18405, outputs='B'
-[2024-08-03 15:16:07] [Rank 0] totoal_tokens=18294, outputs='A'
-[2024-08-03 15:16:07] [Rank 2] totoal_tokens=17788, outputs='A'
-[2024-08-03 15:16:08] [Rank 3] totoal_tokens=18503, outputs='B'
-[2024-08-03 15:16:08] [Rank 0] totoal_tokens=18414, outputs='B'
-[2024-08-03 15:16:08] [Rank 1] totoal_tokens=17836, outputs='A'
-[2024-08-03 15:16:08] [Rank 2] totoal_tokens=17866, outputs='B'
-[2024-08-03 15:16:09] [Rank 3] totoal_tokens=18581, outputs='B'
-[2024-08-03 15:16:09] [Rank 1] totoal_tokens=18140, outputs='A'
-[2024-08-03 15:16:09] [Rank 0] totoal_tokens=18423, outputs='A'
-[2024-08-03 15:16:09] [Rank 2] totoal_tokens=17974, outputs='A'
-[2024-08-03 15:16:10] [Rank 3] totoal_tokens=18581, outputs='B'
-[2024-08-03 15:16:10] [Rank 1] totoal_tokens=18143, outputs='B'
-[2024-08-03 15:16:10] [Rank 2] totoal_tokens=18214, outputs='B'
-[2024-08-03 15:16:10] [Rank 0] totoal_tokens=18449, outputs='B'
-[2024-08-03 15:16:11] [Rank 3] totoal_tokens=18638, outputs='A'
-[2024-08-03 15:16:11] [Rank 1] totoal_tokens=18197, outputs='B'
-[2024-08-03 15:16:11] [Rank 2] totoal_tokens=18312, outputs='B'
-[2024-08-03 15:16:11] [Rank 0] totoal_tokens=18507, outputs='A'
-[2024-08-03 15:16:12] [Rank 1] totoal_tokens=18253, outputs='B'
-[2024-08-03 15:16:12] [Rank 2] totoal_tokens=18371, outputs='B'
-[2024-08-03 15:16:12] [Rank 3] totoal_tokens=18643, outputs='A'
-[2024-08-03 15:16:12] [Rank 0] totoal_tokens=18570, outputs='A'
-[2024-08-03 15:16:12] [Rank 1] totoal_tokens=18253, outputs='B'
-[2024-08-03 15:16:13] [Rank 3] totoal_tokens=18658, outputs='B'
-[2024-08-03 15:16:13] [Rank 2] totoal_tokens=18434, outputs='A'
-[2024-08-03 15:16:13] [Rank 0] totoal_tokens=18646, outputs='B'
-    | 380/734 [02:48<05:41,  1.04it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  52%|█████▏    | 381/734 [02:49<05:27,  1.08it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  52%|█████▏    | 382/734 [02:50<05:39,  1.04it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  52%|█████▏    | 383/734 [02:51<05:44,  1.02it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  52%|█████▏    | 384/734 [02:52<05:45,  1.01it/s]Processing InternVL2-2B_reasoning-image-test.jsonl:  52%|█████▏    | 385/734 [02:53<06:12,  1.07s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  53%|█████▎    | 386/734 [02:54<06:02,  1.04s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  53%|█████▎    | 387/734 [02:56<06:49,  1.18s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  53%|█████▎    | 388/734 [02:57<06:21,  1.10s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  53%|█████�[2024-08-03 15:16:13] [Rank 1] totoal_tokens=18312, outputs='B'
-[2024-08-03 15:16:14] [Rank 2] totoal_tokens=18474, outputs='A'
-[2024-08-03 15:16:14] [Rank 3] totoal_tokens=18702, outputs='A'
-[2024-08-03 15:16:14] [Rank 0] totoal_tokens=18658, outputs='A'
-[2024-08-03 15:16:15] [Rank 1] totoal_tokens=18344, outputs='B'
-[2024-08-03 15:16:15] [Rank 0] totoal_tokens=18658, outputs='B'
-[2024-08-03 15:16:15] [Rank 2] totoal_tokens=18504, outputs='B'
-[2024-08-03 15:16:16] [Rank 1] totoal_tokens=18444, outputs='A'
-[2024-08-03 15:16:16] [Rank 2] totoal_tokens=18520, outputs='A'
-[2024-08-03 15:16:16] [Rank 0] totoal_tokens=18713, outputs='A'
-[2024-08-03 15:16:17] [Rank 3] totoal_tokens=18850, outputs='A'
-[2024-08-03 15:16:17] [Rank 1] totoal_tokens=18596, outputs='B'
-[2024-08-03 15:16:17] [Rank 2] totoal_tokens=18562, outputs='B'
-[2024-08-03 15:16:17] [Rank 0] totoal_tokens=18750, outputs='A'
-[2024-08-03 15:16:18] [Rank 1] totoal_tokens=18659, outputs='B'
-[2024-08-03 15:16:18] [Rank 3] totoal_tokens=18901, outputs='A'
-[2024-08-03 15:16:18] [Rank 2] totoal_tokens=18615, outputs='B'
-[2024-08-03 15:16:19] [Rank 0] totoal_tokens=18785, outputs='A'
-[2024-08-03 15:16:19] [Rank 1] totoal_tokens=18792, outputs='A'
-[2024-08-03 15:16:19] [Rank 3] totoal_tokens=19100, outputs='A'
-[2024-08-03 15:16:19] [Rank 2] totoal_tokens=18680, outputs='A'
-[2024-08-03 15:16:19] [Rank 0] totoal_tokens=18786, outputs='B'
-[2024-08-03 15:16:20] [Rank 3] totoal_tokens=19157, outputs='A'
-[2024-08-03 15:16:20] [Rank 2] totoal_tokens=18689, outputs='A'
-[2024-08-03 15:16:20] [Rank 1] totoal_tokens=18793, outputs='A'
-[2024-08-03 15:16:20] [Rank 0] totoal_tokens=18911, outputs='B'
-[2024-08-03 15:16:21] [Rank 3] totoal_tokens=19264, outputs='B'
-[2024-08-03 15:16:21] [Rank 2] totoal_tokens=18696, outputs='B'
-[2024-08-03 15:16:21] [Rank 1] totoal_tokens=18837, outputs='A'
-[2024-08-03 15:16:22] [Rank 0] totoal_tokens=18926, outputs='A'
-[2024-08-03 15:16:22] [Rank 3] totoal_tokens=19317, outputs='B'
-[2024-08-03 15:16:22] [Rank 2] totoal_tokens=18859, outputs='A'
-[2024-08-03 15:16:22] [Rank 1] totoal_tokens=18947, outputs='B'
-[2024-08-03 15:16:23] [Rank 0] totoal_tokens=19184, outputs='B'
-��    | 389/734 [02:58<05:59,  1.04s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  53%|█████▎    | 390/734 [02:59<06:02,  1.05s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  53%|█████▎    | 391/734 [03:00<05:54,  1.03s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  53%|█████▎    | 392/734 [03:01<06:06,  1.07s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  54%|█████▎    | 393/734 [03:02<06:03,  1.07s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  54%|█████▎    | 394/734 [03:03<05:58,  1.06s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  54%|█████▍    | 395/734 [03:04<05:45,  1.02s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  54%|█████▍    | 396/734 [03:05<05:41,  1.01s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  54%|█████▍    | 397/734 [03:06<05:55,  1.06s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  54%|████�[2024-08-03 15:16:23] [Rank 3] totoal_tokens=19393, outputs='B'
-[2024-08-03 15:16:23] [Rank 2] totoal_tokens=19160, outputs='B'
-[2024-08-03 15:16:23] [Rank 1] totoal_tokens=18947, outputs='B'
-[2024-08-03 15:16:24] [Rank 0] totoal_tokens=19187, outputs='B'
-[2024-08-03 15:16:24] [Rank 2] totoal_tokens=19184, outputs='B'
-[2024-08-03 15:16:24] [Rank 1] totoal_tokens=19055, outputs='A'
-[2024-08-03 15:16:25] [Rank 3] totoal_tokens=19447, outputs='A'
-[2024-08-03 15:16:25] [Rank 0] totoal_tokens=19241, outputs='B'
-[2024-08-03 15:16:25] [Rank 2] totoal_tokens=19249, outputs='B'
-[2024-08-03 15:16:25] [Rank 1] totoal_tokens=19259, outputs='B'
-[2024-08-03 15:16:26] [Rank 3] totoal_tokens=19463, outputs='A'
-[2024-08-03 15:16:26] [Rank 0] totoal_tokens=19332, outputs='A'
-[2024-08-03 15:16:26] [Rank 2] totoal_tokens=19359, outputs='A'
-[2024-08-03 15:16:26] [Rank 1] totoal_tokens=19298, outputs='B'
-[2024-08-03 15:16:27] [Rank 3] totoal_tokens=19491, outputs='A'
-[2024-08-03 15:16:27] [Rank 0] totoal_tokens=19379, outputs='B'
-[2024-08-03 15:16:27] [Rank 2] totoal_tokens=19389, outputs='A'
-[2024-08-03 15:16:27] [Rank 1] totoal_tokens=19352, outputs='B'
-[2024-08-03 15:16:28] [Rank 3] totoal_tokens=19563, outputs='B'
-[2024-08-03 15:16:28] [Rank 0] totoal_tokens=19576, outputs='A'
-[2024-08-03 15:16:28] [Rank 2] totoal_tokens=19409, outputs='A'
-[2024-08-03 15:16:28] [Rank 1] totoal_tokens=19578, outputs='A'
-[2024-08-03 15:16:29] [Rank 0] totoal_tokens=19593, outputs='A'
-[2024-08-03 15:16:29] [Rank 2] totoal_tokens=19543, outputs='A'
-[2024-08-03 15:16:29] [Rank 1] totoal_tokens=19621, outputs='B'
-[2024-08-03 15:16:29] [Rank 3] totoal_tokens=19591, outputs='A'
-[2024-08-03 15:16:30] [Rank 0] totoal_tokens=19629, outputs='A'
-[2024-08-03 15:16:30] [Rank 2] totoal_tokens=19600, outputs='A'
-[2024-08-03 15:16:30] [Rank 1] totoal_tokens=19633, outputs='A'
-[2024-08-03 15:16:31] [Rank 3] totoal_tokens=19591, outputs='A'
-[2024-08-03 15:16:32] [Rank 0] totoal_tokens=19653, outputs='B'
-[2024-08-03 15:16:32] [Rank 2] totoal_tokens=19621, outputs='A'
-[2024-08-03 15:16:32] [Rank 1] totoal_tokens=19635, outputs='A'
-[2024-08-03 15:16:33] [Rank 0] totoal_tokens=19653, outputs='A'
-�▍    | 398/734 [03:07<05:40,  1.01s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  54%|█████▍    | 399/734 [03:08<06:02,  1.08s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  54%|█████▍    | 400/734 [03:09<05:47,  1.04s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  55%|█████▍    | 401/734 [03:10<05:47,  1.04s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  55%|█████▍    | 402/734 [03:11<05:43,  1.03s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  55%|█████▍    | 403/734 [03:12<05:48,  1.05s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  55%|█████▌    | 404/734 [03:13<05:41,  1.03s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  55%|█████▌    | 405/734 [03:15<05:57,  1.09s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  55%|█████▌    | 406/734 [03:16<06:33,  1.20s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  55%|████[2024-08-03 15:16:33] [Rank 2] totoal_tokens=19653, outputs='A'
-[2024-08-03 15:16:33] [Rank 1] totoal_tokens=19726, outputs='B'
-[2024-08-03 15:16:33] [Rank 3] totoal_tokens=19606, outputs='B'
-[2024-08-03 15:16:34] [Rank 0] totoal_tokens=19784, outputs='A'
-[2024-08-03 15:16:34] [Rank 2] totoal_tokens=19753, outputs='A'
-[2024-08-03 15:16:34] [Rank 1] totoal_tokens=19884, outputs='B'
-[2024-08-03 15:16:34] [Rank 3] totoal_tokens=19639, outputs='B'
-[2024-08-03 15:16:35] [Rank 2] totoal_tokens=19861, outputs='B'
-[2024-08-03 15:16:35] [Rank 0] totoal_tokens=19847, outputs='A'
-[2024-08-03 15:16:35] [Rank 1] totoal_tokens=20204, outputs='B'
-[2024-08-03 15:16:35] [Rank 3] totoal_tokens=19773, outputs='A'
-[2024-08-03 15:16:36] [Rank 2] totoal_tokens=20105, outputs='B'
-[2024-08-03 15:16:36] [Rank 0] totoal_tokens=20247, outputs='A'
-[2024-08-03 15:16:36] [Rank 1] totoal_tokens=20500, outputs='A'
-[2024-08-03 15:16:37] [Rank 3] totoal_tokens=19816, outputs='B'
-[2024-08-03 15:16:37] [Rank 2] totoal_tokens=20296, outputs='B'
-[2024-08-03 15:16:38] [Rank 3] totoal_tokens=19840, outputs='A'
-[2024-08-03 15:16:38] [Rank 0] totoal_tokens=20266, outputs='A'
-[2024-08-03 15:16:38] [Rank 1] totoal_tokens=20534, outputs='A'
-[2024-08-03 15:16:38] [Rank 2] totoal_tokens=20396, outputs='B'
-[2024-08-03 15:16:39] [Rank 1] totoal_tokens=20553, outputs='B'
-[2024-08-03 15:16:39] [Rank 3] totoal_tokens=19936, outputs='A'
-[2024-08-03 15:16:39] [Rank 0] totoal_tokens=20285, outputs='B'
-[2024-08-03 15:16:39] [Rank 2] totoal_tokens=20500, outputs='A'
-[2024-08-03 15:16:40] [Rank 1] totoal_tokens=20560, outputs='B'
-[2024-08-03 15:16:40] [Rank 0] totoal_tokens=20450, outputs='B'
-[2024-08-03 15:16:40] [Rank 3] totoal_tokens=19942, outputs='A'
-[2024-08-03 15:16:40] [Rank 2] totoal_tokens=20653, outputs='A'
-[2024-08-03 15:16:41] [Rank 1] totoal_tokens=20576, outputs='A'
-[2024-08-03 15:16:41] [Rank 3] totoal_tokens=20286, outputs='B'
-[2024-08-03 15:16:41] [Rank 0] totoal_tokens=20572, outputs='A'
-[2024-08-03 15:16:41] [Rank 2] totoal_tokens=20671, outputs='A'
-[2024-08-03 15:16:42] [Rank 1] totoal_tokens=20671, outputs='A'
-[2024-08-03 15:16:42] [Rank 3] totoal_tokens=20296, outputs='B'
-[2024-08-03 15:16:42] [Rank 0] totoal_tokens=21021, outputs='B'
-[2024-08-03 15:16:43] [Rank 2] totoal_tokens=20727, outputs='A'
-[2024-08-03 15:16:43] [Rank 1] totoal_tokens=20842, outputs='A'
-[2024-08-03 15:16:43] [Rank 3] totoal_tokens=20418, outputs='B'
-[2024-08-03 15:16:43] [Rank 0] totoal_tokens=21128, outputs='A'
-█▌    | 407/734 [03:17<06:14,  1.15s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  56%|█████▌    | 408/734 [03:18<06:12,  1.14s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  56%|█████▌    | 409/734 [03:19<06:13,  1.15s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  56%|█████▌    | 410/734 [03:20<06:06,  1.13s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  56%|█████▌    | 411/734 [03:22<07:00,  1.30s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  56%|█████▌    | 412/734 [03:24<07:10,  1.34s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  56%|█████▋    | 413/734 [03:24<06:29,  1.21s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  56%|█████▋    | 414/734 [03:26<06:31,  1.22s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  57%|█████▋    | 415/734 [03:27<06:22,  1.20s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  57%|███�[2024-08-03 15:16:44] [Rank 2] totoal_tokens=20791, outputs='A'
-[2024-08-03 15:16:44] [Rank 1] totoal_tokens=20935, outputs='B'
-[2024-08-03 15:16:44] [Rank 3] totoal_tokens=20467, outputs='B'
-[2024-08-03 15:16:45] [Rank 0] totoal_tokens=21132, outputs='A'
-[2024-08-03 15:16:45] [Rank 2] totoal_tokens=21004, outputs='B'
-[2024-08-03 15:16:45] [Rank 1] totoal_tokens=21159, outputs='B'
-[2024-08-03 15:16:45] [Rank 3] totoal_tokens=20612, outputs='B'
-[2024-08-03 15:16:46] [Rank 0] totoal_tokens=21198, outputs='A'
-[2024-08-03 15:16:46] [Rank 2] totoal_tokens=21042, outputs='A'
-[2024-08-03 15:16:46] [Rank 1] totoal_tokens=21370, outputs='A'
-[2024-08-03 15:16:46] [Rank 3] totoal_tokens=20678, outputs='A'
-[2024-08-03 15:16:47] [Rank 0] totoal_tokens=21321, outputs='B'
-[2024-08-03 15:16:47] [Rank 2] totoal_tokens=21143, outputs='B'
-[2024-08-03 15:16:48] [Rank 3] totoal_tokens=20760, outputs='A'
-[2024-08-03 15:16:48] [Rank 1] totoal_tokens=21486, outputs='A'
-[2024-08-03 15:16:48] [Rank 0] totoal_tokens=21478, outputs='A'
-[2024-08-03 15:16:49] [Rank 2] totoal_tokens=21521, outputs='A'
-[2024-08-03 15:16:49] [Rank 3] totoal_tokens=20783, outputs='A'
-[2024-08-03 15:16:49] [Rank 1] totoal_tokens=21519, outputs='A'
-[2024-08-03 15:16:50] [Rank 0] totoal_tokens=21482, outputs='A'
-[2024-08-03 15:16:50] [Rank 2] totoal_tokens=21556, outputs='A'
-[2024-08-03 15:16:50] [Rank 3] totoal_tokens=21102, outputs='A'
-[2024-08-03 15:16:51] [Rank 1] totoal_tokens=21531, outputs='A'
-[2024-08-03 15:16:51] [Rank 2] totoal_tokens=21582, outputs='A'
-[2024-08-03 15:16:51] [Rank 3] totoal_tokens=21103, outputs='A'
-[2024-08-03 15:16:51] [Rank 0] totoal_tokens=21551, outputs='B'
-[2024-08-03 15:16:52] [Rank 1] totoal_tokens=21609, outputs='A'
-[2024-08-03 15:16:52] [Rank 3] totoal_tokens=21110, outputs='B'
-[2024-08-03 15:16:52] [Rank 2] totoal_tokens=21639, outputs='A'
-[2024-08-03 15:16:52] [Rank 0] totoal_tokens=21559, outputs='A'
-[2024-08-03 15:16:53] [Rank 1] totoal_tokens=21837, outputs='B'
-[2024-08-03 15:16:54] [Rank 0] totoal_tokens=21649, outputs='B'
-[2024-08-03 15:16:54] [Rank 2] totoal_tokens=21782, outputs='A'
-[2024-08-03 15:16:54] [Rank 1] totoal_tokens=21868, outputs='B'
-[2024-08-03 15:16:55] [Rank 3] totoal_tokens=21138, outputs='B'
-[2024-08-03 15:16:55] [Rank 0] totoal_tokens=21686, outputs='A'
-��█▋    | 416/734 [03:28<06:09,  1.16s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  57%|█████▋    | 417/734 [03:29<06:19,  1.20s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  57%|█████▋    | 418/734 [03:30<06:20,  1.20s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  57%|█████▋    | 419/734 [03:31<05:57,  1.14s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  57%|█████▋    | 420/734 [03:33<06:14,  1.19s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  57%|█████▋    | 421/734 [03:34<06:53,  1.32s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  57%|█████▋    | 422/734 [03:36<07:04,  1.36s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  58%|█████▊    | 423/734 [03:37<06:42,  1.29s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  58%|█████▊    | 424/734 [03:38<06:24,  1.24s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  58%|██�[2024-08-03 15:16:55] [Rank 1] totoal_tokens=21911, outputs='A'
-[2024-08-03 15:16:55] [Rank 2] totoal_tokens=22136, outputs='A'
-[2024-08-03 15:16:56] [Rank 3] totoal_tokens=21400, outputs='A'
-[2024-08-03 15:16:56] [Rank 1] totoal_tokens=22287, outputs='B'
-[2024-08-03 15:16:57] [Rank 2] totoal_tokens=22395, outputs='A'
-[2024-08-03 15:16:57] [Rank 0] totoal_tokens=21783, outputs='A'
-[2024-08-03 15:16:57] [Rank 3] totoal_tokens=21405, outputs='A'
-[2024-08-03 15:16:58] [Rank 2] totoal_tokens=22449, outputs='B'
-[2024-08-03 15:16:58] [Rank 1] totoal_tokens=22570, outputs='A'
-[2024-08-03 15:16:58] [Rank 3] totoal_tokens=21407, outputs='B'
-[2024-08-03 15:16:58] [Rank 0] totoal_tokens=21914, outputs='A'
-[2024-08-03 15:16:59] [Rank 2] totoal_tokens=22516, outputs='B'
-[2024-08-03 15:16:59] [Rank 1] totoal_tokens=22660, outputs='B'
-[2024-08-03 15:16:59] [Rank 3] totoal_tokens=21407, outputs='B'
-[2024-08-03 15:16:59] [Rank 0] totoal_tokens=22449, outputs='B'
-[2024-08-03 15:17:00] [Rank 2] totoal_tokens=22624, outputs='A'
-[2024-08-03 15:17:00] [Rank 1] totoal_tokens=22717, outputs='B'
-[2024-08-03 15:17:01] [Rank 3] totoal_tokens=21431, outputs='A'
-[2024-08-03 15:17:01] [Rank 0] totoal_tokens=22496, outputs='A'
-[2024-08-03 15:17:01] [Rank 2] totoal_tokens=22717, outputs='B'
-[2024-08-03 15:17:01] [Rank 1] totoal_tokens=22832, outputs='A'
-[2024-08-03 15:17:02] [Rank 0] totoal_tokens=22516, outputs='B'
-[2024-08-03 15:17:02] [Rank 3] totoal_tokens=21645, outputs='A'
-[2024-08-03 15:17:03] [Rank 2] totoal_tokens=23050, outputs='A'
-[2024-08-03 15:17:03] [Rank 1] totoal_tokens=23276, outputs='B'
-[2024-08-03 15:17:04] [Rank 3] totoal_tokens=21709, outputs='A'
-[2024-08-03 15:17:04] [Rank 0] totoal_tokens=22543, outputs='A'
-[2024-08-03 15:17:04] [Rank 2] totoal_tokens=23132, outputs='B'
-[2024-08-03 15:17:04] [Rank 1] totoal_tokens=23286, outputs='B'
-[2024-08-03 15:17:05] [Rank 2] totoal_tokens=23284, outputs='B'
-[2024-08-03 15:17:05] [Rank 3] totoal_tokens=21712, outputs='A'
-[2024-08-03 15:17:06] [Rank 0] totoal_tokens=22600, outputs='B'
-[2024-08-03 15:17:06] [Rank 1] totoal_tokens=23305, outputs='A'
-[2024-08-03 15:17:06] [Rank 2] totoal_tokens=23387, outputs='B'
-[2024-08-03 15:17:07] [Rank 3] totoal_tokens=21782, outputs='A'
-[2024-08-03 15:17:07] [Rank 0] totoal_tokens=22820, outputs='A'
-[2024-08-03 15:17:07] [Rank 1] totoal_tokens=23364, outputs='B'
-[2024-08-03 15:17:08] [Rank 2] totoal_tokens=23400, outputs='A'
-[2024-08-03 15:17:08] [Rank 3] totoal_tokens=21931, outputs='B'
-[2024-08-03 15:17:08] [Rank 0] totoal_tokens=23049, outputs='A'
-�██▊    | 425/734 [03:39<06:19,  1.23s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  58%|█████▊    | 426/734 [03:41<07:13,  1.41s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  58%|█████▊    | 427/734 [03:43<07:46,  1.52s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  58%|█████▊    | 428/734 [03:44<07:02,  1.38s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  58%|█████▊    | 429/734 [03:45<07:19,  1.44s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  59%|█████▊    | 430/734 [03:47<07:15,  1.43s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  59%|█████▊    | 431/734 [03:48<07:07,  1.41s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  59%|█████▉    | 432/734 [03:50<07:45,  1.54s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  59%|█████▉    | 433/734 [03:51<07:16,  1.45s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  59%|██[2024-08-03 15:17:08] [Rank 1] totoal_tokens=23400, outputs='A'
-[2024-08-03 15:17:09] [Rank 2] totoal_tokens=23416, outputs='A'
-[2024-08-03 15:17:10] [Rank 3] totoal_tokens=22044, outputs='B'
-[2024-08-03 15:17:10] [Rank 0] totoal_tokens=23128, outputs='B'
-[2024-08-03 15:17:10] [Rank 1] totoal_tokens=23414, outputs='A'
-[2024-08-03 15:17:10] [Rank 2] totoal_tokens=23485, outputs='A'
-[2024-08-03 15:17:11] [Rank 3] totoal_tokens=22185, outputs='B'
-[2024-08-03 15:17:11] [Rank 0] totoal_tokens=23420, outputs='B'
-[2024-08-03 15:17:12] [Rank 1] totoal_tokens=23523, outputs='A'
-[2024-08-03 15:17:12] [Rank 2] totoal_tokens=23523, outputs='A'
-[2024-08-03 15:17:12] [Rank 3] totoal_tokens=22491, outputs='A'
-[2024-08-03 15:17:13] [Rank 0] totoal_tokens=23444, outputs='A'
-[2024-08-03 15:17:13] [Rank 1] totoal_tokens=23674, outputs='A'
-[2024-08-03 15:17:13] [Rank 3] totoal_tokens=22505, outputs='B'
-[2024-08-03 15:17:13] [Rank 2] totoal_tokens=23576, outputs='B'
-[2024-08-03 15:17:14] [Rank 1] totoal_tokens=23689, outputs='B'
-[2024-08-03 15:17:14] [Rank 0] totoal_tokens=23699, outputs='A'
-[2024-08-03 15:17:14] [Rank 3] totoal_tokens=22645, outputs='B'
-[2024-08-03 15:17:15] [Rank 2] totoal_tokens=23656, outputs='A'
-[2024-08-03 15:17:15] [Rank 1] totoal_tokens=23966, outputs='A'
-[2024-08-03 15:17:16] [Rank 3] totoal_tokens=22828, outputs='B'
-[2024-08-03 15:17:16] [Rank 0] totoal_tokens=24007, outputs='A'
-[2024-08-03 15:17:16] [Rank 2] totoal_tokens=23673, outputs='A'
-[2024-08-03 15:17:17] [Rank 1] totoal_tokens=24170, outputs='A'
-[2024-08-03 15:17:17] [Rank 3] totoal_tokens=23048, outputs='A'
-[2024-08-03 15:17:17] [Rank 2] totoal_tokens=24130, outputs='B'
-[2024-08-03 15:17:18] [Rank 0] totoal_tokens=24023, outputs='A'
-[2024-08-03 15:17:18] [Rank 1] totoal_tokens=24352, outputs='A'
-[2024-08-03 15:17:18] [Rank 2] totoal_tokens=24336, outputs='B'
-[2024-08-03 15:17:19] [Rank 3] totoal_tokens=23188, outputs='B'
-[2024-08-03 15:17:19] [Rank 0] totoal_tokens=24093, outputs='A'
-[2024-08-03 15:17:19] [Rank 1] totoal_tokens=24398, outputs='B'
-[2024-08-03 15:17:20] [Rank 2] totoal_tokens=24407, outputs='B'
-[2024-08-03 15:17:21] [Rank 0] totoal_tokens=24119, outputs='A'
-[2024-08-03 15:17:21] [Rank 1] totoal_tokens=24598, outputs='B'
-[2024-08-03 15:17:21] [Rank 3] totoal_tokens=23188, outputs='A'
-[2024-08-03 15:17:21] [Rank 2] totoal_tokens=24438, outputs='B'
-[2024-08-03 15:17:22] [Rank 3] totoal_tokens=23298, outputs='B'
-[2024-08-03 15:17:22] [Rank 1] totoal_tokens=24826, outputs='A'
-[2024-08-03 15:17:22] [Rank 2] totoal_tokens=24477, outputs='B'
-[2024-08-03 15:17:23] [Rank 0] totoal_tokens=24195, outputs='B'
-███▉    | 434/734 [03:53<07:07,  1.43s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  59%|█████▉    | 435/734 [03:54<07:16,  1.46s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  59%|█████▉    | 436/734 [03:56<07:23,  1.49s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  60%|█████▉    | 437/734 [03:57<07:01,  1.42s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  60%|█████▉    | 438/734 [03:59<07:25,  1.50s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  60%|█████▉    | 439/734 [04:00<07:20,  1.49s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  60%|█████▉    | 440/734 [04:02<07:55,  1.62s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  60%|██████    | 441/734 [04:03<07:31,  1.54s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  60%|██████    | 442/734 [04:05<07:38,  1.57s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  60%|█�[2024-08-03 15:17:23] [Rank 3] totoal_tokens=23490, outputs='B'
-[2024-08-03 15:17:23] [Rank 1] totoal_tokens=24827, outputs='B'
-[2024-08-03 15:17:24] [Rank 2] totoal_tokens=24478, outputs='B'
-[2024-08-03 15:17:24] [Rank 0] totoal_tokens=24246, outputs='B'
-[2024-08-03 15:17:25] [Rank 3] totoal_tokens=23510, outputs='A'
-[2024-08-03 15:17:25] [Rank 2] totoal_tokens=24537, outputs='B'
-[2024-08-03 15:17:25] [Rank 0] totoal_tokens=24260, outputs='B'
-[2024-08-03 15:17:26] [Rank 3] totoal_tokens=23577, outputs='B'
-[2024-08-03 15:17:26] [Rank 1] totoal_tokens=25292, outputs='A'
-[2024-08-03 15:17:26] [Rank 2] totoal_tokens=24594, outputs='A'
-[2024-08-03 15:17:27] [Rank 0] totoal_tokens=24517, outputs='A'
-[2024-08-03 15:17:27] [Rank 3] totoal_tokens=23578, outputs='B'
-[2024-08-03 15:17:27] [Rank 1] totoal_tokens=25312, outputs='B'
-[2024-08-03 15:17:28] [Rank 2] totoal_tokens=24738, outputs='A'
-[2024-08-03 15:17:28] [Rank 0] totoal_tokens=24524, outputs='B'
-[2024-08-03 15:17:28] [Rank 3] totoal_tokens=23618, outputs='B'
-[2024-08-03 15:17:29] [Rank 1] totoal_tokens=25583, outputs='B'
-[2024-08-03 15:17:29] [Rank 0] totoal_tokens=24529, outputs='A'
-[2024-08-03 15:17:29] [Rank 2] totoal_tokens=24792, outputs='A'
-[2024-08-03 15:17:30] [Rank 1] totoal_tokens=25768, outputs='A'
-[2024-08-03 15:17:31] [Rank 0] totoal_tokens=24708, outputs='A'
-[2024-08-03 15:17:31] [Rank 2] totoal_tokens=24831, outputs='A'
-[2024-08-03 15:17:32] [Rank 3] totoal_tokens=23718, outputs='B'
-[2024-08-03 15:17:32] [Rank 1] totoal_tokens=25770, outputs='A'
-[2024-08-03 15:17:32] [Rank 0] totoal_tokens=24731, outputs='A'
-[2024-08-03 15:17:33] [Rank 3] totoal_tokens=24121, outputs='B'
-[2024-08-03 15:17:33] [Rank 2] totoal_tokens=24878, outputs='B'
-[2024-08-03 15:17:33] [Rank 1] totoal_tokens=25946, outputs='A'
-[2024-08-03 15:17:34] [Rank 0] totoal_tokens=24828, outputs='A'
-[2024-08-03 15:17:34] [Rank 3] totoal_tokens=24154, outputs='B'
-[2024-08-03 15:17:35] [Rank 2] totoal_tokens=25130, outputs='B'
-[2024-08-03 15:17:35] [Rank 1] totoal_tokens=26136, outputs='B'
-[2024-08-03 15:17:35] [Rank 0] totoal_tokens=25025, outputs='B'
-��████    | 443/734 [04:07<08:07,  1.68s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  60%|██████    | 444/734 [04:09<07:56,  1.64s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  61%|██████    | 445/734 [04:10<07:15,  1.51s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  61%|██████    | 446/734 [04:11<07:03,  1.47s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  61%|██████    | 447/734 [04:12<06:43,  1.40s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  61%|██████    | 448/734 [04:14<06:42,  1.41s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  61%|██████    | 449/734 [04:15<06:34,  1.38s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  61%|██████▏   | 450/734 [04:17<06:31,  1.38s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  61%|██████▏   | 451/734 [04:18<06:58,  1.48s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  62[2024-08-03 15:17:36] [Rank 3] totoal_tokens=24397, outputs='A'
-[2024-08-03 15:17:36] [Rank 1] totoal_tokens=26148, outputs='B'
-[2024-08-03 15:17:36] [Rank 2] totoal_tokens=25131, outputs='A'
-[2024-08-03 15:17:37] [Rank 3] totoal_tokens=24440, outputs='B'
-[2024-08-03 15:17:38] [Rank 2] totoal_tokens=25178, outputs='B'
-[2024-08-03 15:17:38] [Rank 1] totoal_tokens=26244, outputs='B'
-[2024-08-03 15:17:39] [Rank 3] totoal_tokens=24544, outputs='A'
-[2024-08-03 15:17:39] [Rank 0] totoal_tokens=25214, outputs='B'
-[2024-08-03 15:17:39] [Rank 2] totoal_tokens=25414, outputs='A'
-[2024-08-03 15:17:40] [Rank 3] totoal_tokens=24562, outputs='B'
-[2024-08-03 15:17:40] [Rank 1] totoal_tokens=26415, outputs='A'
-[2024-08-03 15:17:40] [Rank 0] totoal_tokens=25263, outputs='B'
-[2024-08-03 15:17:41] [Rank 2] totoal_tokens=25508, outputs='A'
-[2024-08-03 15:17:41] [Rank 3] totoal_tokens=24831, outputs='A'
-[2024-08-03 15:17:41] [Rank 1] totoal_tokens=26442, outputs='A'
-[2024-08-03 15:17:42] [Rank 0] totoal_tokens=25516, outputs='A'
-[2024-08-03 15:17:42] [Rank 2] totoal_tokens=25570, outputs='B'
-[2024-08-03 15:17:43] [Rank 3] totoal_tokens=24884, outputs='A'
-[2024-08-03 15:17:43] [Rank 0] totoal_tokens=25582, outputs='A'
-[2024-08-03 15:17:44] [Rank 1] totoal_tokens=26478, outputs='A'
-[2024-08-03 15:17:44] [Rank 2] totoal_tokens=25588, outputs='B'
-[2024-08-03 15:17:44] [Rank 3] totoal_tokens=25179, outputs='B'
-[2024-08-03 15:17:45] [Rank 0] totoal_tokens=25900, outputs='A'
-[2024-08-03 15:17:45] [Rank 2] totoal_tokens=25702, outputs='A'
-[2024-08-03 15:17:46] [Rank 3] totoal_tokens=25282, outputs='A'
-[2024-08-03 15:17:46] [Rank 1] totoal_tokens=26638, outputs='B'
-[2024-08-03 15:17:46] [Rank 0] totoal_tokens=26291, outputs='A'
-[2024-08-03 15:17:47] [Rank 2] totoal_tokens=25872, outputs='B'
-[2024-08-03 15:17:47] [Rank 3] totoal_tokens=25380, outputs='A'
-[2024-08-03 15:17:48] [Rank 1] totoal_tokens=26913, outputs='A'
-[2024-08-03 15:17:48] [Rank 2] totoal_tokens=26350, outputs='B'
-[2024-08-03 15:17:49] [Rank 3] totoal_tokens=25504, outputs='A'
-[2024-08-03 15:17:49] [Rank 0] totoal_tokens=26377, outputs='A'
-[2024-08-03 15:17:49] [Rank 2] totoal_tokens=26353, outputs='A'
-[2024-08-03 15:17:49] [Rank 1] totoal_tokens=27196, outputs='B'
-[2024-08-03 15:17:51] [Rank 3] totoal_tokens=25583, outputs='B'
-[2024-08-03 15:17:51] [Rank 0] totoal_tokens=26387, outputs='A'
-[2024-08-03 15:17:51] [Rank 2] totoal_tokens=26484, outputs='A'
-[2024-08-03 15:17:51] [Rank 1] totoal_tokens=27202, outputs='B'
-[2024-08-03 15:17:52] [Rank 3] totoal_tokens=25739, outputs='A'
-[2024-08-03 15:17:52] [Rank 0] totoal_tokens=26395, outputs='B'
-%|██████▏   | 452/734 [04:20<06:43,  1.43s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  62%|██████▏   | 453/734 [04:23<10:05,  2.15s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  62%|██████▏   | 454/734 [04:25<08:50,  1.90s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  62%|██████▏   | 455/734 [04:26<08:32,  1.84s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  62%|██████▏   | 456/734 [04:28<07:57,  1.72s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  62%|██████▏   | 457/734 [04:29<07:43,  1.67s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  62%|██████▏   | 458/734 [04:31<07:16,  1.58s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  63%|██████▎   | 459/734 [04:33<08:24,  1.83s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  63%|██████▎   | 460/734 [04:35<08:42,  1.91s/it]Processing InternVL2-2B_reasoning-i[2024-08-03 15:17:53] [Rank 2] totoal_tokens=26519, outputs='B'
-[2024-08-03 15:17:54] [Rank 0] totoal_tokens=26442, outputs='A'
-[2024-08-03 15:17:54] [Rank 1] totoal_tokens=27217, outputs='A'
-[2024-08-03 15:17:55] [Rank 2] totoal_tokens=26549, outputs='A'
-[2024-08-03 15:17:55] [Rank 3] totoal_tokens=25750, outputs='A'
-[2024-08-03 15:17:55] [Rank 0] totoal_tokens=26521, outputs='B'
-[2024-08-03 15:17:55] [Rank 1] totoal_tokens=27286, outputs='B'
-[2024-08-03 15:17:56] [Rank 2] totoal_tokens=26578, outputs='B'
-[2024-08-03 15:17:56] [Rank 3] totoal_tokens=26045, outputs='B'
-[2024-08-03 15:17:56] [Rank 0] totoal_tokens=26578, outputs='B'
-[2024-08-03 15:17:57] [Rank 1] totoal_tokens=27288, outputs='B'
-[2024-08-03 15:17:57] [Rank 2] totoal_tokens=26679, outputs='A'
-[2024-08-03 15:17:58] [Rank 1] totoal_tokens=27355, outputs='A'
-[2024-08-03 15:17:58] [Rank 3] totoal_tokens=26352, outputs='A'
-[2024-08-03 15:17:59] [Rank 0] totoal_tokens=26593, outputs='A'
-[2024-08-03 15:17:59] [Rank 2] totoal_tokens=27165, outputs='A'
-[2024-08-03 15:18:00] [Rank 3] totoal_tokens=26417, outputs='A'
-[2024-08-03 15:18:01] [Rank 0] totoal_tokens=26644, outputs='A'
-[2024-08-03 15:18:01] [Rank 1] totoal_tokens=27398, outputs='B'
-[2024-08-03 15:18:01] [Rank 2] totoal_tokens=27335, outputs='B'
-[2024-08-03 15:18:01] [Rank 3] totoal_tokens=26460, outputs='A'
-[2024-08-03 15:18:02] [Rank 1] totoal_tokens=27419, outputs='A'
-[2024-08-03 15:18:03] [Rank 3] totoal_tokens=26570, outputs='A'
-[2024-08-03 15:18:03] [Rank 0] totoal_tokens=26668, outputs='A'
-[2024-08-03 15:18:03] [Rank 2] totoal_tokens=27408, outputs='A'
-[2024-08-03 15:18:04] [Rank 1] totoal_tokens=27428, outputs='A'
-[2024-08-03 15:18:04] [Rank 0] totoal_tokens=26679, outputs='A'
-[2024-08-03 15:18:04] [Rank 3] totoal_tokens=26606, outputs='B'
-[2024-08-03 15:18:05] [Rank 2] totoal_tokens=27433, outputs='A'
-[2024-08-03 15:18:06] [Rank 1] totoal_tokens=27450, outputs='A'
-[2024-08-03 15:18:06] [Rank 0] totoal_tokens=26695, outputs='A'
-[2024-08-03 15:18:06] [Rank 2] totoal_tokens=27643, outputs='B'
-[2024-08-03 15:18:07] [Rank 3] totoal_tokens=26903, outputs='A'
-[2024-08-03 15:18:07] [Rank 0] totoal_tokens=27205, outputs='B'
-mage-test.jsonl:  63%|██████▎   | 461/734 [04:37<07:53,  1.74s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  63%|██████▎   | 462/734 [04:38<07:21,  1.62s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  63%|██████▎   | 463/734 [04:39<07:00,  1.55s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  63%|██████▎   | 464/734 [04:41<06:36,  1.47s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  63%|██████▎   | 465/734 [04:43<07:48,  1.74s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  63%|██████▎   | 466/734 [04:45<08:26,  1.89s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  64%|██████▎   | 467/734 [04:47<08:34,  1.93s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  64%|██████▍   | 468/734 [04:49<07:54,  1.78s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  64%|██████▍   | 469/734 [04:50<07:27,  1.69s/it]Processing Inte[2024-08-03 15:18:07] [Rank 1] totoal_tokens=27454, outputs='A'
-[2024-08-03 15:18:08] [Rank 2] totoal_tokens=27709, outputs='A'
-[2024-08-03 15:18:08] [Rank 3] totoal_tokens=26971, outputs='B'
-[2024-08-03 15:18:09] [Rank 1] totoal_tokens=27506, outputs='A'
-[2024-08-03 15:18:09] [Rank 2] totoal_tokens=27719, outputs='B'
-[2024-08-03 15:18:09] [Rank 0] totoal_tokens=27206, outputs='B'
-[2024-08-03 15:18:10] [Rank 3] totoal_tokens=27354, outputs='B'
-[2024-08-03 15:18:11] [Rank 1] totoal_tokens=27508, outputs='A'
-[2024-08-03 15:18:11] [Rank 0] totoal_tokens=27381, outputs='B'
-[2024-08-03 15:18:11] [Rank 2] totoal_tokens=27720, outputs='A'
-[2024-08-03 15:18:11] [Rank 3] totoal_tokens=27369, outputs='A'
-[2024-08-03 15:18:12] [Rank 1] totoal_tokens=27678, outputs='B'
-[2024-08-03 15:18:13] [Rank 0] totoal_tokens=27444, outputs='B'
-[2024-08-03 15:18:13] [Rank 2] totoal_tokens=27858, outputs='A'
-[2024-08-03 15:18:13] [Rank 3] totoal_tokens=27437, outputs='A'
-[2024-08-03 15:18:14] [Rank 1] totoal_tokens=27924, outputs='B'
-[2024-08-03 15:18:14] [Rank 2] totoal_tokens=27881, outputs='A'
-[2024-08-03 15:18:15] [Rank 0] totoal_tokens=27507, outputs='A'
-[2024-08-03 15:18:15] [Rank 3] totoal_tokens=27493, outputs='A'
-[2024-08-03 15:18:15] [Rank 1] totoal_tokens=28148, outputs='A'
-[2024-08-03 15:18:16] [Rank 2] totoal_tokens=27929, outputs='B'
-[2024-08-03 15:18:17] [Rank 3] totoal_tokens=27507, outputs='A'
-[2024-08-03 15:18:17] [Rank 1] totoal_tokens=28187, outputs='B'
-[2024-08-03 15:18:18] [Rank 2] totoal_tokens=28402, outputs='B'
-[2024-08-03 15:18:18] [Rank 0] totoal_tokens=27612, outputs='A'
-[2024-08-03 15:18:18] [Rank 1] totoal_tokens=28220, outputs='B'
-[2024-08-03 15:18:19] [Rank 3] totoal_tokens=27524, outputs='A'
-[2024-08-03 15:18:19] [Rank 2] totoal_tokens=28464, outputs='B'
-[2024-08-03 15:18:19] [Rank 0] totoal_tokens=27672, outputs='A'
-[2024-08-03 15:18:20] [Rank 3] totoal_tokens=27561, outputs='B'
-[2024-08-03 15:18:20] [Rank 1] totoal_tokens=28293, outputs='B'
-[2024-08-03 15:18:21] [Rank 0] totoal_tokens=27959, outputs='B'
-[2024-08-03 15:18:22] [Rank 1] totoal_tokens=28480, outputs='A'
-[2024-08-03 15:18:22] [Rank 2] totoal_tokens=28529, outputs='A'
-[2024-08-03 15:18:23] [Rank 0] totoal_tokens=28142, outputs='B'
-rnVL2-2B_reasoning-image-test.jsonl:  64%|██████▍   | 470/734 [04:52<06:57,  1.58s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  64%|██████▍   | 471/734 [04:54<07:39,  1.75s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  64%|██████▍   | 472/734 [04:55<07:20,  1.68s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  64%|██████▍   | 473/734 [04:57<07:46,  1.79s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  65%|██████▍   | 474/734 [04:59<08:05,  1.87s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  65%|██████▍   | 475/734 [05:02<09:25,  2.19s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  65%|██████▍   | 476/734 [05:04<08:37,  2.01s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  65%|██████▍   | 477/734 [05:06<08:20,  1.95s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  65%|██████▌   | 478/734 [05:08<08:19,  1.95s[2024-08-03 15:18:24] [Rank 1] totoal_tokens=28541, outputs='A'
-[2024-08-03 15:18:24] [Rank 3] totoal_tokens=27678, outputs='A'
-[2024-08-03 15:18:24] [Rank 2] totoal_tokens=28598, outputs='B'
-[2024-08-03 15:18:25] [Rank 0] totoal_tokens=28148, outputs='A'
-[2024-08-03 15:18:25] [Rank 1] totoal_tokens=28681, outputs='B'
-[2024-08-03 15:18:25] [Rank 3] totoal_tokens=27719, outputs='A'
-[2024-08-03 15:18:26] [Rank 2] totoal_tokens=28612, outputs='B'
-[2024-08-03 15:18:27] [Rank 1] totoal_tokens=28858, outputs='A'
-[2024-08-03 15:18:27] [Rank 0] totoal_tokens=28192, outputs='B'
-[2024-08-03 15:18:27] [Rank 3] totoal_tokens=27959, outputs='B'
-[2024-08-03 15:18:28] [Rank 2] totoal_tokens=29036, outputs='B'
-[2024-08-03 15:18:29] [Rank 3] totoal_tokens=28141, outputs='B'
-[2024-08-03 15:18:29] [Rank 0] totoal_tokens=28368, outputs='A'
-[2024-08-03 15:18:29] [Rank 1] totoal_tokens=29607, outputs='A'
-[2024-08-03 15:18:29] [Rank 2] totoal_tokens=29332, outputs='B'
-[2024-08-03 15:18:30] [Rank 3] totoal_tokens=28244, outputs='B'
-[2024-08-03 15:18:30] [Rank 0] totoal_tokens=28434, outputs='A'
-[2024-08-03 15:18:31] [Rank 1] totoal_tokens=30237, outputs='B'
-[2024-08-03 15:18:31] [Rank 2] totoal_tokens=29462, outputs='B'
-[2024-08-03 15:18:32] [Rank 0] totoal_tokens=28464, outputs='B'
-[2024-08-03 15:18:32] [Rank 1] totoal_tokens=30509, outputs='A'
-[2024-08-03 15:18:33] [Rank 2] totoal_tokens=29512, outputs='A'
-[2024-08-03 15:18:33] [Rank 3] totoal_tokens=28363, outputs='A'
-[2024-08-03 15:18:33] [Rank 0] totoal_tokens=28473, outputs='B'
-[2024-08-03 15:18:34] [Rank 1] totoal_tokens=31373, outputs='B'
-[2024-08-03 15:18:34] [Rank 3] totoal_tokens=28398, outputs='B'
-[2024-08-03 15:18:35] [Rank 0] totoal_tokens=28473, outputs='A'
-[2024-08-03 15:18:35] [Rank 2] totoal_tokens=29771, outputs='A'
-[2024-08-03 15:18:35] [Rank 3] totoal_tokens=28402, outputs='B'
-[2024-08-03 15:18:36] [Rank 0] totoal_tokens=28536, outputs='B'
-[2024-08-03 15:18:37] [Rank 2] totoal_tokens=30370, outputs='A'
-[2024-08-03 15:18:37] [Rank 1] totoal_tokens=31488, outputs='A'
-[2024-08-03 15:18:38] [Rank 3] totoal_tokens=28429, outputs='A'
-[2024-08-03 15:18:38] [Rank 0] totoal_tokens=28602, outputs='A'
-/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  65%|██████▌   | 479/734 [05:09<07:55,  1.87s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  65%|██████▌   | 480/734 [05:11<08:24,  1.98s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  66%|██████▌   | 481/734 [05:13<07:56,  1.88s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  66%|██████▌   | 482/734 [05:15<07:33,  1.80s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  66%|██████▌   | 483/734 [05:16<07:05,  1.70s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  66%|██████▌   | 484/734 [05:18<06:42,  1.61s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  66%|██████▌   | 485/734 [05:19<06:42,  1.62s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  66%|██████▌   | 486/734 [05:21<06:29,  1.57s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  66%|██████▋   | 487/734 [2024-08-03 15:18:38] [Rank 2] totoal_tokens=30448, outputs='A'
-[2024-08-03 15:18:39] [Rank 1] totoal_tokens=31622, outputs='A'
-[2024-08-03 15:18:39] [Rank 3] totoal_tokens=28635, outputs='B'
-[2024-08-03 15:18:40] [Rank 0] totoal_tokens=28687, outputs='A'
-[2024-08-03 15:18:40] [Rank 2] totoal_tokens=30487, outputs='B'
-[2024-08-03 15:18:41] [Rank 3] totoal_tokens=29402, outputs='A'
-[2024-08-03 15:18:41] [Rank 1] totoal_tokens=31704, outputs='A'
-[2024-08-03 15:18:42] [Rank 0] totoal_tokens=28739, outputs='A'
-[2024-08-03 15:18:42] [Rank 2] totoal_tokens=30551, outputs='A'
-[2024-08-03 15:18:43] [Rank 3] totoal_tokens=29821, outputs='A'
-[2024-08-03 15:18:43] [Rank 1] totoal_tokens=31866, outputs='A'
-[2024-08-03 15:18:43] [Rank 0] totoal_tokens=29037, outputs='A'
-[2024-08-03 15:18:44] [Rank 2] totoal_tokens=30757, outputs='B'
-[2024-08-03 15:18:45] [Rank 0] totoal_tokens=29577, outputs='B'
-[2024-08-03 15:18:46] [Rank 1] totoal_tokens=32128, outputs='B'
-[2024-08-03 15:18:47] [Rank 2] totoal_tokens=30786, outputs='A'
-[2024-08-03 15:18:47] [Rank 3] totoal_tokens=30381, outputs='A'
-[2024-08-03 15:18:48] [Rank 1] totoal_tokens=32260, outputs='B'
-[2024-08-03 15:18:48] [Rank 0] totoal_tokens=29888, outputs='A'
-[2024-08-03 15:18:48] [Rank 3] totoal_tokens=30494, outputs='B'
-[2024-08-03 15:18:50] [Rank 2] totoal_tokens=31328, outputs='B'
-[2024-08-03 15:18:50] [Rank 1] totoal_tokens=32607, outputs='A'
-[2024-08-03 15:18:50] [Rank 0] totoal_tokens=30350, outputs='A'
-[2024-08-03 15:18:50] [Rank 3] totoal_tokens=30666, outputs='A'
-[2024-08-03 15:18:52] [Rank 0] totoal_tokens=30380, outputs='B'
-[2024-08-03 15:18:52] [Rank 1] totoal_tokens=32757, outputs='A'
-[2024-08-03 15:18:52] [Rank 2] totoal_tokens=31435, outputs='A'
-[2024-08-03 15:18:52] [Rank 3] totoal_tokens=30695, outputs='A'
-[2024-08-03 15:18:53] [Rank 2] totoal_tokens=31464, outputs='B'
-[2024-08-03 15:18:54] [Rank 1] totoal_tokens=32836, outputs='A'
-[2024-08-03 15:18:54] [Rank 3] totoal_tokens=30720, outputs='A'
-[2024-08-03 15:18:55] [Rank 0] totoal_tokens=30450, outputs='A'
-[2024-08-03 15:18:55] [Rank 3] totoal_tokens=30794, outputs='B'
-[2024-08-03 15:18:56] [Rank 1] totoal_tokens=33189, outputs='B'
-[2024-08-03 15:18:57] [Rank 2] totoal_tokens=31496, outputs='A'
-[2024-08-03 15:18:57] [Rank 0] totoal_tokens=30969, outputs='A'
-[05:23<07:03,  1.71s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  66%|██████▋   | 488/734 [05:24<06:59,  1.70s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  67%|██████▋   | 489/734 [05:26<06:56,  1.70s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  67%|██████▋   | 490/734 [05:28<07:03,  1.73s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  67%|██████▋   | 491/734 [05:30<07:20,  1.81s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  67%|██████▋   | 492/734 [05:32<07:55,  1.97s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  67%|██████▋   | 493/734 [05:34<08:03,  2.01s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  67%|██████▋   | 494/734 [05:36<07:38,  1.91s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  67%|██████▋   | 495/734 [05:40<09:45,  2.45s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  68%|████�[2024-08-03 15:18:57] [Rank 3] totoal_tokens=30862, outputs='A'
-[2024-08-03 15:18:58] [Rank 1] totoal_tokens=33419, outputs='A'
-[2024-08-03 15:18:59] [Rank 2] totoal_tokens=31501, outputs='B'
-[2024-08-03 15:18:59] [Rank 0] totoal_tokens=31116, outputs='A'
-[2024-08-03 15:18:59] [Rank 3] totoal_tokens=31500, outputs='B'
-[2024-08-03 15:19:00] [Rank 1] totoal_tokens=33818, outputs='B'
-[2024-08-03 15:19:01] [Rank 0] totoal_tokens=31139, outputs='B'
-[2024-08-03 15:19:01] [Rank 3] totoal_tokens=31636, outputs='B'
-[2024-08-03 15:19:01] [Rank 2] totoal_tokens=31565, outputs='A'
-[2024-08-03 15:19:02] [Rank 0] totoal_tokens=31292, outputs='B'
-[2024-08-03 15:19:02] [Rank 1] totoal_tokens=34025, outputs='A'
-[2024-08-03 15:19:03] [Rank 2] totoal_tokens=31601, outputs='A'
-[2024-08-03 15:19:04] [Rank 3] totoal_tokens=31781, outputs='A'
-[2024-08-03 15:19:05] [Rank 2] totoal_tokens=32218, outputs='B'
-[2024-08-03 15:19:05] [Rank 1] totoal_tokens=34205, outputs='A'
-[2024-08-03 15:19:05] [Rank 3] totoal_tokens=32059, outputs='A'
-[2024-08-03 15:19:06] [Rank 0] totoal_tokens=31299, outputs='B'
-[2024-08-03 15:19:07] [Rank 2] totoal_tokens=32439, outputs='A'
-[2024-08-03 15:19:07] [Rank 1] totoal_tokens=34389, outputs='A'
-[2024-08-03 15:19:07] [Rank 0] totoal_tokens=31445, outputs='A'
-[2024-08-03 15:19:08] [Rank 3] totoal_tokens=32301, outputs='A'
-[2024-08-03 15:19:09] [Rank 0] totoal_tokens=31448, outputs='B'
-[2024-08-03 15:19:10] [Rank 3] totoal_tokens=32313, outputs='A'
-[2024-08-03 15:19:10] [Rank 1] totoal_tokens=34593, outputs='A'
-[2024-08-03 15:19:10] [Rank 2] totoal_tokens=33097, outputs='B'
-[2024-08-03 15:19:11] [Rank 0] totoal_tokens=31632, outputs='A'
-[2024-08-03 15:19:12] [Rank 2] totoal_tokens=33199, outputs='B'
-[2024-08-03 15:19:12] [Rank 3] totoal_tokens=32376, outputs='A'
-[2024-08-03 15:19:13] [Rank 0] totoal_tokens=32158, outputs='B'
-[2024-08-03 15:19:13] [Rank 1] totoal_tokens=34989, outputs='A'
-[2024-08-03 15:19:14] [Rank 2] totoal_tokens=33276, outputs='B'
-[2024-08-03 15:19:14] [Rank 3] totoal_tokens=32522, outputs='A'
-[2024-08-03 15:19:15] [Rank 1] totoal_tokens=35209, outputs='B'
-[2024-08-03 15:19:15] [Rank 0] totoal_tokens=32475, outputs='B'
-�█▊   | 496/734 [05:41<08:53,  2.24s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  68%|██████▊   | 497/734 [05:43<08:24,  2.13s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  68%|██████▊   | 498/734 [05:45<07:43,  1.96s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  68%|██████▊   | 499/734 [05:47<07:34,  1.93s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  68%|██████▊   | 500/734 [05:50<09:11,  2.36s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  68%|██████▊   | 501/734 [05:52<08:24,  2.17s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  68%|██████▊   | 502/734 [05:54<07:48,  2.02s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  69%|██████▊   | 503/734 [05:56<07:53,  2.05s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  69%|██████▊   | 504/734 [05:57<07:17,  1.90s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:[2024-08-03 15:19:16] [Rank 3] totoal_tokens=32742, outputs='B'
-[2024-08-03 15:19:17] [Rank 2] totoal_tokens=33407, outputs='A'
-[2024-08-03 15:19:17] [Rank 1] totoal_tokens=35377, outputs='A'
-[2024-08-03 15:19:17] [Rank 0] totoal_tokens=32494, outputs='A'
-[2024-08-03 15:19:18] [Rank 3] totoal_tokens=32991, outputs='B'
-[2024-08-03 15:19:19] [Rank 2] totoal_tokens=33485, outputs='A'
-[2024-08-03 15:19:19] [Rank 1] totoal_tokens=35408, outputs='A'
-[2024-08-03 15:19:20] [Rank 0] totoal_tokens=32881, outputs='A'
-[2024-08-03 15:19:20] [Rank 3] totoal_tokens=33130, outputs='B'
-[2024-08-03 15:19:20] [Rank 2] totoal_tokens=34136, outputs='B'
-[2024-08-03 15:19:21] [Rank 1] totoal_tokens=35558, outputs='B'
-[2024-08-03 15:19:22] [Rank 0] totoal_tokens=33259, outputs='B'
-[2024-08-03 15:19:22] [Rank 2] totoal_tokens=34191, outputs='B'
-[2024-08-03 15:19:23] [Rank 3] totoal_tokens=33249, outputs='B'
-[2024-08-03 15:19:23] [Rank 1] totoal_tokens=35615, outputs='A'
-[2024-08-03 15:19:24] [Rank 2] totoal_tokens=34333, outputs='B'
-[2024-08-03 15:19:25] [Rank 3] totoal_tokens=33259, outputs='B'
-[2024-08-03 15:19:25] [Rank 0] totoal_tokens=33531, outputs='A'
-[2024-08-03 15:19:26] [Rank 1] totoal_tokens=35946, outputs='A'
-[2024-08-03 15:19:26] [Rank 2] totoal_tokens=35525, outputs='A'
-[2024-08-03 15:19:27] [Rank 3] totoal_tokens=33343, outputs='B'
-[2024-08-03 15:19:27] [Rank 0] totoal_tokens=33554, outputs='A'
-[2024-08-03 15:19:28] [Rank 1] totoal_tokens=36321, outputs='A'
-[2024-08-03 15:19:28] [Rank 2] totoal_tokens=35617, outputs='B'
-[2024-08-03 15:19:29] [Rank 3] totoal_tokens=33354, outputs='B'
-[2024-08-03 15:19:30] [Rank 0] totoal_tokens=33589, outputs='A'
-[2024-08-03 15:19:31] [Rank 1] totoal_tokens=36448, outputs='B'
-[2024-08-03 15:19:31] [Rank 2] totoal_tokens=35840, outputs='A'
-[2024-08-03 15:19:32] [Rank 3] totoal_tokens=33558, outputs='A'
-[2024-08-03 15:19:33] [Rank 0] totoal_tokens=33718, outputs='A'
-[2024-08-03 15:19:33] [Rank 1] totoal_tokens=36488, outputs='A'
-[2024-08-03 15:19:33] [Rank 2] totoal_tokens=35891, outputs='A'
-[2024-08-03 15:19:34] [Rank 3] totoal_tokens=34241, outputs='B'
-[2024-08-03 15:19:35] [Rank 0] totoal_tokens=33904, outputs='A'
-[2024-08-03 15:19:36] [Rank 1] totoal_tokens=36679, outputs='A'
-[2024-08-03 15:19:36] [Rank 0] totoal_tokens=34173, outputs='B'
-  69%|██████▉   | 505/734 [06:00<08:00,  2.10s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  69%|██████▉   | 506/734 [06:02<07:47,  2.05s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  69%|██████▉   | 507/734 [06:04<08:11,  2.17s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  69%|██████▉   | 508/734 [06:06<08:11,  2.17s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  69%|██████▉   | 509/734 [06:09<08:54,  2.38s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  69%|██████▉   | 510/734 [06:12<09:06,  2.44s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  70%|██████▉   | 511/734 [06:15<09:49,  2.64s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  70%|██████▉   | 512/734 [06:17<09:26,  2.55s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  70%|██████▉   | 513/734 [06:19<08:33,  2.32s/it]Processing InternVL2-2B_reasoni[2024-08-03 15:19:36] [Rank 2] totoal_tokens=36143, outputs='A'
-[2024-08-03 15:19:37] [Rank 3] totoal_tokens=35282, outputs='B'
-[2024-08-03 15:19:38] [Rank 1] totoal_tokens=36971, outputs='A'
-[2024-08-03 15:19:38] [Rank 0] totoal_tokens=34447, outputs='A'
-[2024-08-03 15:19:39] [Rank 3] totoal_tokens=35336, outputs='B'
-[2024-08-03 15:19:39] [Rank 2] totoal_tokens=36399, outputs='B'
-[2024-08-03 15:19:40] [Rank 1] totoal_tokens=37038, outputs='A'
-[2024-08-03 15:19:40] [Rank 0] totoal_tokens=34588, outputs='A'
-[2024-08-03 15:19:41] [Rank 2] totoal_tokens=36602, outputs='A'
-[2024-08-03 15:19:41] [Rank 3] totoal_tokens=35444, outputs='B'
-[2024-08-03 15:19:42] [Rank 0] totoal_tokens=34700, outputs='B'
-[2024-08-03 15:19:43] [Rank 1] totoal_tokens=37220, outputs='B'
-[2024-08-03 15:19:43] [Rank 3] totoal_tokens=35837, outputs='B'
-[2024-08-03 15:19:45] [Rank 1] totoal_tokens=37235, outputs='B'
-[2024-08-03 15:19:45] [Rank 0] totoal_tokens=35081, outputs='A'
-[2024-08-03 15:19:45] [Rank 2] totoal_tokens=37053, outputs='A'
-[2024-08-03 15:19:46] [Rank 3] totoal_tokens=36130, outputs='A'
-[2024-08-03 15:19:47] [Rank 0] totoal_tokens=35394, outputs='B'
-[2024-08-03 15:19:47] [Rank 2] totoal_tokens=37276, outputs='A'
-[2024-08-03 15:19:47] [Rank 1] totoal_tokens=37235, outputs='B'
-[2024-08-03 15:19:49] [Rank 3] totoal_tokens=36312, outputs='B'
-[2024-08-03 15:19:49] [Rank 1] totoal_tokens=37441, outputs='B'
-[2024-08-03 15:19:49] [Rank 2] totoal_tokens=37327, outputs='A'
-[2024-08-03 15:19:50] [Rank 0] totoal_tokens=35605, outputs='B'
-[2024-08-03 15:19:51] [Rank 3] totoal_tokens=36413, outputs='B'
-[2024-08-03 15:19:52] [Rank 2] totoal_tokens=37375, outputs='A'
-[2024-08-03 15:19:52] [Rank 0] totoal_tokens=35825, outputs='A'
-[2024-08-03 15:19:52] [Rank 1] totoal_tokens=37463, outputs='B'
-[2024-08-03 15:19:53] [Rank 3] totoal_tokens=36413, outputs='B'
-[2024-08-03 15:19:54] [Rank 2] totoal_tokens=37439, outputs='A'
-[2024-08-03 15:19:54] [Rank 0] totoal_tokens=35997, outputs='A'
-[2024-08-03 15:19:55] [Rank 1] totoal_tokens=37466, outputs='B'
-[2024-08-03 15:19:56] [Rank 3] totoal_tokens=36434, outputs='A'
-[2024-08-03 15:19:56] [Rank 2] totoal_tokens=37460, outputs='A'
-[2024-08-03 15:19:56] [Rank 0] totoal_tokens=36137, outputs='B'
-ng-image-test.jsonl:  70%|███████   | 514/734 [06:21<07:53,  2.15s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  70%|███████   | 515/734 [06:23<07:41,  2.11s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  70%|███████   | 516/734 [06:25<07:35,  2.09s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  70%|███████   | 517/734 [06:27<07:27,  2.06s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  71%|███████   | 518/734 [06:29<08:03,  2.24s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  71%|███████   | 519/734 [06:32<07:59,  2.23s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  71%|███████   | 520/734 [06:34<08:20,  2.34s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  71%|███████   | 521/734 [06:37<08:11,  2.31s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  71%|███████   | 522/734 [06:39<08:12,  2.32s/it]Processing [2024-08-03 15:19:58] [Rank 1] totoal_tokens=37469, outputs='A'
-[2024-08-03 15:19:58] [Rank 3] totoal_tokens=36677, outputs='A'
-[2024-08-03 15:19:58] [Rank 2] totoal_tokens=37522, outputs='B'
-[2024-08-03 15:19:59] [Rank 0] totoal_tokens=36733, outputs='A'
-[2024-08-03 15:20:00] [Rank 3] totoal_tokens=36681, outputs='B'
-[2024-08-03 15:20:01] [Rank 0] totoal_tokens=37025, outputs='A'
-[2024-08-03 15:20:01] [Rank 1] totoal_tokens=37534, outputs='A'
-[2024-08-03 15:20:03] [Rank 3] totoal_tokens=36706, outputs='A'
-[2024-08-03 15:20:03] [Rank 1] totoal_tokens=37806, outputs='B'
-[2024-08-03 15:20:03] [Rank 0] totoal_tokens=37261, outputs='B'
-[2024-08-03 15:20:04] [Rank 2] totoal_tokens=37542, outputs='A'
-[2024-08-03 15:20:05] [Rank 3] totoal_tokens=36733, outputs='A'
-[2024-08-03 15:20:05] [Rank 1] totoal_tokens=37897, outputs='A'
-[2024-08-03 15:20:06] [Rank 0] totoal_tokens=37370, outputs='A'
-[2024-08-03 15:20:06] [Rank 2] totoal_tokens=37643, outputs='A'
-[2024-08-03 15:20:07] [Rank 3] totoal_tokens=36792, outputs='A'
-[2024-08-03 15:20:08] [Rank 1] totoal_tokens=38004, outputs='B'
-[2024-08-03 15:20:08] [Rank 0] totoal_tokens=37393, outputs='B'
-[2024-08-03 15:20:08] [Rank 2] totoal_tokens=37721, outputs='B'
-[2024-08-03 15:20:10] [Rank 3] totoal_tokens=36842, outputs='A'
-[2024-08-03 15:20:10] [Rank 0] totoal_tokens=37494, outputs='A'
-[2024-08-03 15:20:10] [Rank 2] totoal_tokens=37724, outputs='B'
-[2024-08-03 15:20:10] [Rank 1] totoal_tokens=38160, outputs='A'
-[2024-08-03 15:20:12] [Rank 3] totoal_tokens=36892, outputs='A'
-[2024-08-03 15:20:13] [Rank 1] totoal_tokens=38327, outputs='A'
-[2024-08-03 15:20:13] [Rank 0] totoal_tokens=37624, outputs='A'
-[2024-08-03 15:20:14] [Rank 3] totoal_tokens=37083, outputs='A'
-[2024-08-03 15:20:14] [Rank 2] totoal_tokens=37783, outputs='A'
-[2024-08-03 15:20:15] [Rank 0] totoal_tokens=37885, outputs='B'
-InternVL2-2B_reasoning-image-test.jsonl:  71%|███████▏  | 523/734 [06:41<07:48,  2.22s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  71%|███████▏  | 524/734 [06:43<07:49,  2.24s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  72%|███████▏  | 525/734 [06:46<07:59,  2.30s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  72%|███████▏  | 526/734 [06:48<07:54,  2.28s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  72%|███████▏  | 527/734 [06:50<07:44,  2.24s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  72%|███████▏  | 528/734 [06:52<07:42,  2.24s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  72%|███████▏  | 529/734 [06:55<07:56,  2.32s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  72%|███████▏  | 530/734 [06:58<08:31,  2.51s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  72%|███████▏  | 531/73[2024-08-03 15:20:15] [Rank 1] totoal_tokens=38398, outputs='B'
-[2024-08-03 15:20:16] [Rank 3] totoal_tokens=37302, outputs='A'
-[2024-08-03 15:20:18] [Rank 0] totoal_tokens=38195, outputs='A'
-[2024-08-03 15:20:18] [Rank 2] totoal_tokens=37955, outputs='A'
-[2024-08-03 15:20:19] [Rank 3] totoal_tokens=37346, outputs='A'
-[2024-08-03 15:20:19] [Rank 1] totoal_tokens=38681, outputs='A'
-[2024-08-03 15:20:20] [Rank 0] totoal_tokens=38455, outputs='B'
-[2024-08-03 15:20:20] [Rank 2] totoal_tokens=38232, outputs='B'
-[2024-08-03 15:20:21] [Rank 3] totoal_tokens=37361, outputs='A'
-[2024-08-03 15:20:21] [Rank 1] totoal_tokens=38759, outputs='A'
-[2024-08-03 15:20:22] [Rank 0] totoal_tokens=38613, outputs='A'
-[2024-08-03 15:20:23] [Rank 2] totoal_tokens=38269, outputs='B'
-[2024-08-03 15:20:23] [Rank 3] totoal_tokens=37497, outputs='A'
-[2024-08-03 15:20:24] [Rank 1] totoal_tokens=38771, outputs='A'
-[2024-08-03 15:20:25] [Rank 2] totoal_tokens=38349, outputs='B'
-[2024-08-03 15:20:25] [Rank 0] totoal_tokens=38671, outputs='A'
-[2024-08-03 15:20:25] [Rank 3] totoal_tokens=37594, outputs='A'
-[2024-08-03 15:20:26] [Rank 1] totoal_tokens=38899, outputs='B'
-[2024-08-03 15:20:27] [Rank 2] totoal_tokens=38351, outputs='B'
-[2024-08-03 15:20:27] [Rank 0] totoal_tokens=39039, outputs='B'
-[2024-08-03 15:20:27] [Rank 3] totoal_tokens=37624, outputs='A'
-[2024-08-03 15:20:28] [Rank 1] totoal_tokens=39126, outputs='B'
-[2024-08-03 15:20:29] [Rank 0] totoal_tokens=39090, outputs='A'
-[2024-08-03 15:20:29] [Rank 2] totoal_tokens=38417, outputs='B'
-[2024-08-03 15:20:30] [Rank 3] totoal_tokens=37685, outputs='A'
-[2024-08-03 15:20:31] [Rank 1] totoal_tokens=39195, outputs='B'
-[2024-08-03 15:20:31] [Rank 2] totoal_tokens=38449, outputs='B'
-[2024-08-03 15:20:32] [Rank 0] totoal_tokens=39165, outputs='B'
-[2024-08-03 15:20:32] [Rank 3] totoal_tokens=37709, outputs='B'
-[2024-08-03 15:20:33] [Rank 1] totoal_tokens=39441, outputs='A'
-[2024-08-03 15:20:34] [Rank 3] totoal_tokens=37771, outputs='B'
-[2024-08-03 15:20:34] [Rank 0] totoal_tokens=39166, outputs='A'
-[2024-08-03 15:20:34] [Rank 2] totoal_tokens=38464, outputs='B'
-[2024-08-03 15:20:36] [Rank 1] totoal_tokens=39541, outputs='B'
-[2024-08-03 15:20:36] [Rank 3] totoal_tokens=37899, outputs='A'
-[2024-08-03 15:20:37] [Rank 0] totoal_tokens=39269, outputs='B'
-4 [07:00<07:58,  2.36s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  72%|███████▏  | 532/734 [07:02<07:56,  2.36s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  73%|███████▎  | 533/734 [07:04<07:35,  2.27s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  73%|███████▎  | 534/734 [07:06<07:38,  2.29s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  73%|███████▎  | 535/734 [07:09<08:12,  2.48s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  73%|███████▎  | 536/734 [07:11<07:45,  2.35s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  73%|███████▎  | 537/734 [07:14<07:38,  2.33s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  73%|███████▎  | 538/734 [07:16<07:38,  2.34s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  73%|███████▎  | 539/734 [07:18<07:26,  2.29s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  [2024-08-03 15:20:37] [Rank 2] totoal_tokens=38511, outputs='B'
-[2024-08-03 15:20:39] [Rank 3] totoal_tokens=37959, outputs='A'
-[2024-08-03 15:20:39] [Rank 0] totoal_tokens=39358, outputs='A'
-[2024-08-03 15:20:39] [Rank 2] totoal_tokens=38638, outputs='B'
-[2024-08-03 15:20:39] [Rank 1] totoal_tokens=39658, outputs='A'
-[2024-08-03 15:20:41] [Rank 0] totoal_tokens=39408, outputs='A'
-[2024-08-03 15:20:42] [Rank 2] totoal_tokens=38671, outputs='A'
-[2024-08-03 15:20:43] [Rank 1] totoal_tokens=39733, outputs='B'
-[2024-08-03 15:20:43] [Rank 3] totoal_tokens=38169, outputs='B'
-[2024-08-03 15:20:44] [Rank 0] totoal_tokens=39481, outputs='B'
-[2024-08-03 15:20:45] [Rank 3] totoal_tokens=38357, outputs='B'
-[2024-08-03 15:20:45] [Rank 1] totoal_tokens=39754, outputs='A'
-[2024-08-03 15:20:45] [Rank 2] totoal_tokens=38790, outputs='A'
-[2024-08-03 15:20:47] [Rank 0] totoal_tokens=39725, outputs='B'
-[2024-08-03 15:20:47] [Rank 3] totoal_tokens=38435, outputs='A'
-[2024-08-03 15:20:48] [Rank 1] totoal_tokens=39976, outputs='A'
-[2024-08-03 15:20:48] [Rank 2] totoal_tokens=39139, outputs='B'
-[2024-08-03 15:20:49] [Rank 0] totoal_tokens=39726, outputs='A'
-[2024-08-03 15:20:50] [Rank 3] totoal_tokens=38628, outputs='A'
-[2024-08-03 15:20:50] [Rank 2] totoal_tokens=39172, outputs='B'
-[2024-08-03 15:20:51] [Rank 1] totoal_tokens=40314, outputs='B'
-[2024-08-03 15:20:52] [Rank 0] totoal_tokens=39738, outputs='B'
-[2024-08-03 15:20:52] [Rank 3] totoal_tokens=38928, outputs='B'
-[2024-08-03 15:20:52] [Rank 2] totoal_tokens=39306, outputs='B'
-[2024-08-03 15:20:54] [Rank 1] totoal_tokens=40322, outputs='B'
-[2024-08-03 15:20:54] [Rank 0] totoal_tokens=39835, outputs='B'
-[2024-08-03 15:20:54] [Rank 3] totoal_tokens=39129, outputs='B'
-[2024-08-03 15:20:55] [Rank 2] totoal_tokens=39371, outputs='A'
-[2024-08-03 15:20:56] [Rank 1] totoal_tokens=40368, outputs='B'
-[2024-08-03 15:20:56] [Rank 3] totoal_tokens=39172, outputs='B'
-[2024-08-03 15:20:56] [Rank 0] totoal_tokens=39960, outputs='A'
-[2024-08-03 15:20:57] [Rank 2] totoal_tokens=39409, outputs='B'
-[2024-08-03 15:20:58] [Rank 3] totoal_tokens=39211, outputs='B'
-[2024-08-03 15:20:58] [Rank 0] totoal_tokens=40190, outputs='B'
-74%|███████▎  | 540/734 [07:21<07:55,  2.45s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  74%|███████▎  | 541/734 [07:24<07:58,  2.48s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  74%|███████▍  | 542/734 [07:26<07:44,  2.42s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  74%|███████▍  | 543/734 [07:28<07:42,  2.42s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  74%|███████▍  | 544/734 [07:31<07:53,  2.49s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  74%|███████▍  | 545/734 [07:34<08:13,  2.61s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  74%|███████▍  | 546/734 [07:36<07:51,  2.51s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  75%|███████▍  | 547/734 [07:38<07:36,  2.44s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  75%|███████▍  | 548/734 [07:41<07:30,  2.42s/it]Processing Inte[2024-08-03 15:20:59] [Rank 1] totoal_tokens=40447, outputs='A'
-[2024-08-03 15:21:00] [Rank 2] totoal_tokens=39613, outputs='B'
-[2024-08-03 15:21:01] [Rank 3] totoal_tokens=39272, outputs='B'
-[2024-08-03 15:21:01] [Rank 0] totoal_tokens=40234, outputs='B'
-[2024-08-03 15:21:02] [Rank 1] totoal_tokens=40558, outputs='A'
-[2024-08-03 15:21:03] [Rank 2] totoal_tokens=39701, outputs='A'
-[2024-08-03 15:21:03] [Rank 3] totoal_tokens=39476, outputs='A'
-[2024-08-03 15:21:03] [Rank 0] totoal_tokens=40307, outputs='B'
-[2024-08-03 15:21:04] [Rank 1] totoal_tokens=40593, outputs='B'
-[2024-08-03 15:21:05] [Rank 2] totoal_tokens=39938, outputs='B'
-[2024-08-03 15:21:05] [Rank 3] totoal_tokens=39580, outputs='A'
-[2024-08-03 15:21:07] [Rank 1] totoal_tokens=40597, outputs='B'
-[2024-08-03 15:21:08] [Rank 3] totoal_tokens=39602, outputs='A'
-[2024-08-03 15:21:08] [Rank 2] totoal_tokens=39951, outputs='B'
-[2024-08-03 15:21:08] [Rank 0] totoal_tokens=40361, outputs='A'
-[2024-08-03 15:21:10] [Rank 3] totoal_tokens=39690, outputs='B'
-[2024-08-03 15:21:10] [Rank 0] totoal_tokens=40491, outputs='B'
-[2024-08-03 15:21:10] [Rank 1] totoal_tokens=40599, outputs='B'
-[2024-08-03 15:21:11] [Rank 2] totoal_tokens=40141, outputs='B'
-[2024-08-03 15:21:12] [Rank 3] totoal_tokens=39705, outputs='A'
-[2024-08-03 15:21:13] [Rank 0] totoal_tokens=40512, outputs='B'
-[2024-08-03 15:21:13] [Rank 1] totoal_tokens=40754, outputs='A'
-[2024-08-03 15:21:13] [Rank 2] totoal_tokens=40333, outputs='A'
-[2024-08-03 15:21:15] [Rank 3] totoal_tokens=39712, outputs='A'
-[2024-08-03 15:21:15] [Rank 0] totoal_tokens=40729, outputs='A'
-[2024-08-03 15:21:15] [Rank 1] totoal_tokens=40765, outputs='B'
-[2024-08-03 15:21:16] [Rank 2] totoal_tokens=40338, outputs='A'
-[2024-08-03 15:21:17] [Rank 3] totoal_tokens=39849, outputs='A'
-[2024-08-03 15:21:18] [Rank 0] totoal_tokens=40740, outputs='A'
-[2024-08-03 15:21:18] [Rank 1] totoal_tokens=40917, outputs='A'
-[2024-08-03 15:21:18] [Rank 2] totoal_tokens=40470, outputs='B'
-[2024-08-03 15:21:20] [Rank 3] totoal_tokens=40327, outputs='B'
-[2024-08-03 15:21:21] [Rank 1] totoal_tokens=40922, outputs='A'
-[2024-08-03 15:21:21] [Rank 2] totoal_tokens=40485, outputs='A'
-[2024-08-03 15:21:21] [Rank 0] totoal_tokens=40796, outputs='B'
-rnVL2-2B_reasoning-image-test.jsonl:  75%|███████▍  | 549/734 [07:43<07:13,  2.34s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  75%|███████▍  | 550/734 [07:45<07:10,  2.34s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  75%|███████▌  | 551/734 [07:48<07:08,  2.34s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  75%|███████▌  | 552/734 [07:52<09:17,  3.06s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  75%|███████▌  | 553/734 [07:55<08:36,  2.85s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  75%|███████▌  | 554/734 [07:57<08:01,  2.68s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  76%|███████▌  | 555/734 [07:59<07:45,  2.60s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  76%|███████▌  | 556/734 [08:02<08:04,  2.72s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  76%|███████▌  | 557/734 [0[2024-08-03 15:21:22] [Rank 3] totoal_tokens=40396, outputs='A'
-[2024-08-03 15:21:23] [Rank 1] totoal_tokens=40938, outputs='B'
-[2024-08-03 15:21:24] [Rank 2] totoal_tokens=40729, outputs='A'
-[2024-08-03 15:21:24] [Rank 0] totoal_tokens=40851, outputs='A'
-[2024-08-03 15:21:25] [Rank 3] totoal_tokens=40485, outputs='A'
-[2024-08-03 15:21:26] [Rank 1] totoal_tokens=42481, outputs='B'
-[2024-08-03 15:21:26] [Rank 0] totoal_tokens=40855, outputs='B'
-[2024-08-03 15:21:26] [Rank 2] totoal_tokens=41211, outputs='A'
-[2024-08-03 15:21:28] [Rank 3] totoal_tokens=40655, outputs='A'
-[2024-08-03 15:21:28] [Rank 1] totoal_tokens=42618, outputs='A'
-[2024-08-03 15:21:29] [Rank 0] totoal_tokens=40868, outputs='B'
-[2024-08-03 15:21:29] [Rank 2] totoal_tokens=41355, outputs='B'
-[2024-08-03 15:21:30] [Rank 3] totoal_tokens=41044, outputs='A'
-[2024-08-03 15:21:31] [Rank 0] totoal_tokens=41358, outputs='B'
-[2024-08-03 15:21:31] [Rank 1] totoal_tokens=42644, outputs='B'
-[2024-08-03 15:21:31] [Rank 2] totoal_tokens=41448, outputs='B'
-[2024-08-03 15:21:32] [Rank 3] totoal_tokens=41283, outputs='B'
-[2024-08-03 15:21:34] [Rank 2] totoal_tokens=41639, outputs='B'
-[2024-08-03 15:21:34] [Rank 0] totoal_tokens=41488, outputs='A'
-[2024-08-03 15:21:35] [Rank 3] totoal_tokens=41355, outputs='B'
-[2024-08-03 15:21:35] [Rank 1] totoal_tokens=42773, outputs='A'
-[2024-08-03 15:21:36] [Rank 0] totoal_tokens=41740, outputs='A'
-[2024-08-03 15:21:37] [Rank 2] totoal_tokens=41767, outputs='A'
-[2024-08-03 15:21:37] [Rank 3] totoal_tokens=41423, outputs='B'
-[2024-08-03 15:21:38] [Rank 1] totoal_tokens=42857, outputs='B'
-[2024-08-03 15:21:39] [Rank 0] totoal_tokens=42451, outputs='B'
-[2024-08-03 15:21:40] [Rank 2] totoal_tokens=42116, outputs='B'
-[2024-08-03 15:21:40] [Rank 3] totoal_tokens=41488, outputs='A'
-[2024-08-03 15:21:40] [Rank 1] totoal_tokens=42862, outputs='A'
-[2024-08-03 15:21:42] [Rank 0] totoal_tokens=42716, outputs='A'
-[2024-08-03 15:21:42] [Rank 2] totoal_tokens=42363, outputs='B'
-[2024-08-03 15:21:43] [Rank 1] totoal_tokens=42940, outputs='B'
-[2024-08-03 15:21:43] [Rank 3] totoal_tokens=41638, outputs='A'
-[2024-08-03 15:21:44] [Rank 0] totoal_tokens=42866, outputs='B'
-8:06<08:39,  2.93s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  76%|███████▌  | 558/734 [08:08<08:11,  2.79s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  76%|███████▌  | 559/734 [08:11<07:48,  2.68s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  76%|███████▋  | 560/734 [08:13<07:23,  2.55s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  76%|███████▋  | 561/734 [08:15<07:07,  2.47s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  77%|███████▋  | 562/734 [08:18<07:38,  2.66s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  77%|███████▋  | 563/734 [08:21<07:29,  2.63s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  77%|███████▋  | 564/734 [08:24<07:26,  2.63s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  77%|███████▋  | 565/734 [08:26<07:26,  2.64s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  77%|[2024-08-03 15:21:45] [Rank 2] totoal_tokens=42477, outputs='A'
-[2024-08-03 15:21:45] [Rank 1] totoal_tokens=43179, outputs='A'
-[2024-08-03 15:21:46] [Rank 3] totoal_tokens=41750, outputs='A'
-[2024-08-03 15:21:47] [Rank 2] totoal_tokens=42490, outputs='B'
-[2024-08-03 15:21:49] [Rank 1] totoal_tokens=43646, outputs='B'
-[2024-08-03 15:21:49] [Rank 0] totoal_tokens=43265, outputs='A'
-[2024-08-03 15:21:49] [Rank 2] totoal_tokens=42507, outputs='B'
-[2024-08-03 15:21:50] [Rank 3] totoal_tokens=41808, outputs='A'
-[2024-08-03 15:21:51] [Rank 1] totoal_tokens=43653, outputs='A'
-[2024-08-03 15:21:52] [Rank 0] totoal_tokens=43291, outputs='A'
-[2024-08-03 15:21:52] [Rank 2] totoal_tokens=42531, outputs='B'
-[2024-08-03 15:21:52] [Rank 3] totoal_tokens=41908, outputs='A'
-[2024-08-03 15:21:54] [Rank 1] totoal_tokens=43686, outputs='B'
-[2024-08-03 15:21:54] [Rank 2] totoal_tokens=42592, outputs='A'
-[2024-08-03 15:21:55] [Rank 3] totoal_tokens=41955, outputs='B'
-[2024-08-03 15:21:55] [Rank 0] totoal_tokens=43359, outputs='A'
-[2024-08-03 15:21:56] [Rank 1] totoal_tokens=43945, outputs='A'
-[2024-08-03 15:21:57] [Rank 2] totoal_tokens=42618, outputs='A'
-[2024-08-03 15:21:57] [Rank 3] totoal_tokens=42015, outputs='A'
-[2024-08-03 15:21:59] [Rank 0] totoal_tokens=43717, outputs='A'
-[2024-08-03 15:22:00] [Rank 2] totoal_tokens=42739, outputs='A'
-[2024-08-03 15:22:00] [Rank 1] totoal_tokens=44394, outputs='A'
-[2024-08-03 15:22:00] [Rank 3] totoal_tokens=42143, outputs='B'
-[2024-08-03 15:22:01] [Rank 0] totoal_tokens=43765, outputs='B'
-[2024-08-03 15:22:02] [Rank 2] totoal_tokens=42842, outputs='B'
-[2024-08-03 15:22:03] [Rank 3] totoal_tokens=42197, outputs='B'
-[2024-08-03 15:22:03] [Rank 1] totoal_tokens=44456, outputs='A'
-[2024-08-03 15:22:04] [Rank 0] totoal_tokens=44153, outputs='A'
-[2024-08-03 15:22:04] [Rank 2] totoal_tokens=42862, outputs='A'
-[2024-08-03 15:22:05] [Rank 1] totoal_tokens=44665, outputs='B'
-[2024-08-03 15:22:06] [Rank 3] totoal_tokens=42263, outputs='B'
-[2024-08-03 15:22:06] [Rank 0] totoal_tokens=44250, outputs='B'
-[2024-08-03 15:22:08] [Rank 2] totoal_tokens=43066, outputs='A'
-[2024-08-03 15:22:08] [Rank 1] totoal_tokens=44947, outputs='B'
-[2024-08-03 15:22:10] [Rank 0] totoal_tokens=44356, outputs='A'
-[2024-08-03 15:22:10] [Rank 3] totoal_tokens=42421, outputs='A'
-[2024-08-03 15:22:11] [Rank 1] totoal_tokens=44987, outputs='A'
-[2024-08-03 15:22:12] [Rank 3] totoal_tokens=42433, outputs='B'
-[2024-08-03 15:22:12] [Rank 2] totoal_tokens=43240, outputs='A'
-[2024-08-03 15:22:12] [Rank 0] totoal_tokens=44787, outputs='B'
-███████▋  | 566/734 [08:29<07:12,  2.57s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  77%|███████▋  | 567/734 [08:33<08:55,  3.21s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  77%|███████▋  | 568/734 [08:36<08:24,  3.04s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  78%|███████▊  | 569/734 [08:40<08:48,  3.20s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  78%|███████▊  | 570/734 [08:43<08:55,  3.27s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  78%|███████▊  | 571/734 [08:45<08:16,  3.05s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  78%|███████▊  | 572/734 [08:48<07:58,  2.95s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  78%|███████▊  | 573/734 [08:51<07:34,  2.83s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  78%|███████▊  | 574/734 [08:54<07:50,  2.94s/it]Processing InternVL[2024-08-03 15:22:14] [Rank 1] totoal_tokens=45081, outputs='A'
-[2024-08-03 15:22:15] [Rank 3] totoal_tokens=42437, outputs='A'
-[2024-08-03 15:22:15] [Rank 0] totoal_tokens=45245, outputs='A'
-[2024-08-03 15:22:16] [Rank 2] totoal_tokens=43743, outputs='A'
-[2024-08-03 15:22:16] [Rank 1] totoal_tokens=45540, outputs='B'
-[2024-08-03 15:22:18] [Rank 3] totoal_tokens=42544, outputs='A'
-[2024-08-03 15:22:18] [Rank 2] totoal_tokens=43834, outputs='B'
-[2024-08-03 15:22:19] [Rank 0] totoal_tokens=45361, outputs='B'
-[2024-08-03 15:22:20] [Rank 1] totoal_tokens=45666, outputs='A'
-[2024-08-03 15:22:20] [Rank 3] totoal_tokens=43121, outputs='B'
-[2024-08-03 15:22:21] [Rank 2] totoal_tokens=43995, outputs='A'
-[2024-08-03 15:22:22] [Rank 0] totoal_tokens=45530, outputs='A'
-[2024-08-03 15:22:22] [Rank 3] totoal_tokens=43436, outputs='B'
-[2024-08-03 15:22:23] [Rank 1] totoal_tokens=45691, outputs='A'
-[2024-08-03 15:22:23] [Rank 2] totoal_tokens=44010, outputs='B'
-[2024-08-03 15:22:24] [Rank 0] totoal_tokens=45683, outputs='A'
-[2024-08-03 15:22:25] [Rank 1] totoal_tokens=46060, outputs='B'
-[2024-08-03 15:22:26] [Rank 2] totoal_tokens=44371, outputs='A'
-[2024-08-03 15:22:26] [Rank 3] totoal_tokens=43583, outputs='A'
-[2024-08-03 15:22:27] [Rank 0] totoal_tokens=45692, outputs='B'
-[2024-08-03 15:22:28] [Rank 1] totoal_tokens=46134, outputs='B'
-[2024-08-03 15:22:30] [Rank 2] totoal_tokens=44800, outputs='A'
-[2024-08-03 15:22:30] [Rank 3] totoal_tokens=43768, outputs='A'
-[2024-08-03 15:22:30] [Rank 0] totoal_tokens=45712, outputs='B'
-[2024-08-03 15:22:31] [Rank 1] totoal_tokens=46146, outputs='B'
-[2024-08-03 15:22:33] [Rank 3] totoal_tokens=44128, outputs='B'
-[2024-08-03 15:22:33] [Rank 2] totoal_tokens=45057, outputs='A'
-[2024-08-03 15:22:34] [Rank 1] totoal_tokens=47036, outputs='A'
-[2024-08-03 15:22:34] [Rank 0] totoal_tokens=46015, outputs='A'
-[2024-08-03 15:22:36] [Rank 3] totoal_tokens=44177, outputs='B'
-[2024-08-03 15:22:36] [Rank 2] totoal_tokens=45279, outputs='B'
-[2024-08-03 15:22:37] [Rank 0] totoal_tokens=46158, outputs='B'
-2-2B_reasoning-image-test.jsonl:  78%|███████▊  | 575/734 [08:57<07:49,  2.95s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  78%|███████▊  | 576/734 [09:00<07:31,  2.85s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  79%|███████▊  | 577/734 [09:03<08:15,  3.15s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  79%|███████▊  | 578/734 [09:06<07:48,  3.00s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  79%|███████▉  | 579/734 [09:09<07:39,  2.96s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  79%|███████▉  | 580/734 [09:12<07:33,  2.94s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  79%|███████▉  | 581/734 [09:15<07:29,  2.94s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  79%|███████▉  | 582/734 [09:19<08:09,  3.22s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  79%|███████▉  | 583/734 [09:21[2024-08-03 15:22:37] [Rank 1] totoal_tokens=47168, outputs='A'
-[2024-08-03 15:22:38] [Rank 3] totoal_tokens=44494, outputs='B'
-[2024-08-03 15:22:38] [Rank 2] totoal_tokens=45662, outputs='B'
-[2024-08-03 15:22:39] [Rank 0] totoal_tokens=46411, outputs='B'
-[2024-08-03 15:22:40] [Rank 1] totoal_tokens=47171, outputs='A'
-[2024-08-03 15:22:41] [Rank 2] totoal_tokens=45975, outputs='A'
-[2024-08-03 15:22:42] [Rank 0] totoal_tokens=47173, outputs='A'
-[2024-08-03 15:22:42] [Rank 3] totoal_tokens=44689, outputs='A'
-[2024-08-03 15:22:43] [Rank 1] totoal_tokens=47176, outputs='B'
-[2024-08-03 15:22:44] [Rank 2] totoal_tokens=46326, outputs='A'
-[2024-08-03 15:22:45] [Rank 3] totoal_tokens=45131, outputs='B'
-[2024-08-03 15:22:45] [Rank 0] totoal_tokens=47456, outputs='A'
-[2024-08-03 15:22:46] [Rank 1] totoal_tokens=47282, outputs='B'
-[2024-08-03 15:22:47] [Rank 2] totoal_tokens=46797, outputs='A'
-[2024-08-03 15:22:47] [Rank 3] totoal_tokens=45280, outputs='B'
-[2024-08-03 15:22:48] [Rank 0] totoal_tokens=47469, outputs='B'
-[2024-08-03 15:22:49] [Rank 1] totoal_tokens=47682, outputs='A'
-[2024-08-03 15:22:50] [Rank 2] totoal_tokens=47008, outputs='A'
-[2024-08-03 15:22:50] [Rank 3] totoal_tokens=45328, outputs='B'
-[2024-08-03 15:22:51] [Rank 0] totoal_tokens=47546, outputs='A'
-[2024-08-03 15:22:52] [Rank 1] totoal_tokens=48320, outputs='A'
-[2024-08-03 15:22:53] [Rank 3] totoal_tokens=45401, outputs='B'
-[2024-08-03 15:22:54] [Rank 2] totoal_tokens=47059, outputs='A'
-[2024-08-03 15:22:54] [Rank 0] totoal_tokens=47613, outputs='A'
-[2024-08-03 15:22:55] [Rank 1] totoal_tokens=48863, outputs='B'
-[2024-08-03 15:22:56] [Rank 3] totoal_tokens=45553, outputs='A'
-[2024-08-03 15:22:58] [Rank 1] totoal_tokens=49118, outputs='B'
-[2024-08-03 15:22:58] [Rank 0] totoal_tokens=47908, outputs='A'
-[2024-08-03 15:22:58] [Rank 2] totoal_tokens=47148, outputs='A'
-[2024-08-03 15:22:59] [Rank 3] totoal_tokens=45963, outputs='A'
-[2024-08-03 15:23:01] [Rank 0] totoal_tokens=47946, outputs='A'
-[2024-08-03 15:23:01] [Rank 2] totoal_tokens=47256, outputs='A'
-[2024-08-03 15:23:02] [Rank 3] totoal_tokens=46326, outputs='A'
-[2024-08-03 15:23:02] [Rank 1] totoal_tokens=49627, outputs='A'
-[2024-08-03 15:23:04] [Rank 0] totoal_tokens=48228, outputs='B'
-<07:38,  3.04s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  80%|███████▉  | 584/734 [09:24<07:13,  2.89s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  80%|███████▉  | 585/734 [09:27<07:12,  2.90s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  80%|███████▉  | 586/734 [09:30<07:22,  2.99s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  80%|███████▉  | 587/734 [09:33<07:06,  2.90s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  80%|████████  | 588/734 [09:35<07:00,  2.88s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  80%|████████  | 589/734 [09:38<07:03,  2.92s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  80%|████████  | 590/734 [09:42<07:44,  3.22s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  81%|████████  | 591/734 [09:45<07:34,  3.18s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  81%|█�[2024-08-03 15:23:05] [Rank 2] totoal_tokens=47307, outputs='B'
-[2024-08-03 15:23:05] [Rank 3] totoal_tokens=46459, outputs='B'
-[2024-08-03 15:23:05] [Rank 1] totoal_tokens=49684, outputs='B'
-[2024-08-03 15:23:07] [Rank 0] totoal_tokens=48487, outputs='B'
-[2024-08-03 15:23:08] [Rank 2] totoal_tokens=47847, outputs='B'
-[2024-08-03 15:23:08] [Rank 3] totoal_tokens=47025, outputs='B'
-[2024-08-03 15:23:08] [Rank 1] totoal_tokens=49818, outputs='B'
-[2024-08-03 15:23:10] [Rank 0] totoal_tokens=48775, outputs='B'
-[2024-08-03 15:23:11] [Rank 2] totoal_tokens=47938, outputs='A'
-[2024-08-03 15:23:11] [Rank 3] totoal_tokens=47193, outputs='A'
-[2024-08-03 15:23:11] [Rank 1] totoal_tokens=50324, outputs='B'
-[2024-08-03 15:23:13] [Rank 0] totoal_tokens=48838, outputs='A'
-[2024-08-03 15:23:14] [Rank 3] totoal_tokens=47298, outputs='B'
-[2024-08-03 15:23:14] [Rank 2] totoal_tokens=48212, outputs='A'
-[2024-08-03 15:23:15] [Rank 1] totoal_tokens=50327, outputs='A'
-[2024-08-03 15:23:17] [Rank 0] totoal_tokens=48890, outputs='B'
-[2024-08-03 15:23:18] [Rank 3] totoal_tokens=47496, outputs='A'
-[2024-08-03 15:23:18] [Rank 2] totoal_tokens=48944, outputs='A'
-[2024-08-03 15:23:19] [Rank 0] totoal_tokens=49135, outputs='A'
-[2024-08-03 15:23:20] [Rank 1] totoal_tokens=50365, outputs='A'
-[2024-08-03 15:23:21] [Rank 3] totoal_tokens=47663, outputs='B'
-[2024-08-03 15:23:21] [Rank 2] totoal_tokens=49746, outputs='A'
-[2024-08-03 15:23:23] [Rank 0] totoal_tokens=49528, outputs='A'
-[2024-08-03 15:23:23] [Rank 1] totoal_tokens=50382, outputs='A'
-[2024-08-03 15:23:24] [Rank 3] totoal_tokens=47847, outputs='A'
-[2024-08-03 15:23:24] [Rank 2] totoal_tokens=50450, outputs='A'
-[2024-08-03 15:23:26] [Rank 3] totoal_tokens=48106, outputs='B'
-[2024-08-03 15:23:27] [Rank 0] totoal_tokens=49612, outputs='A'
-[2024-08-03 15:23:27] [Rank 1] totoal_tokens=50391, outputs='A'
-[2024-08-03 15:23:28] [Rank 2] totoal_tokens=50550, outputs='A'
-[2024-08-03 15:23:29] [Rank 0] totoal_tokens=49818, outputs='B'
-[2024-08-03 15:23:31] [Rank 3] totoal_tokens=48485, outputs='A'
-[2024-08-03 15:23:31] [Rank 1] totoal_tokens=50469, outputs='B'
-[2024-08-03 15:23:31] [Rank 2] totoal_tokens=50696, outputs='A'
-[2024-08-03 15:23:32] [Rank 0] totoal_tokens=50110, outputs='B'
-��██████  | 592/734 [09:48<07:16,  3.07s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  81%|████████  | 593/734 [09:51<07:02,  2.99s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  81%|████████  | 594/734 [09:54<06:54,  2.96s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  81%|████████  | 595/734 [09:58<07:24,  3.20s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  81%|████████  | 596/734 [10:01<07:23,  3.21s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  81%|████████▏ | 597/734 [10:04<07:07,  3.12s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  81%|████████▏ | 598/734 [10:07<07:24,  3.27s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  82%|████████▏ | 599/734 [10:11<07:31,  3.35s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  82%|████████▏ | 600/734 [10:14<07:05,  3.17s/it]Processing Inte[2024-08-03 15:23:33] [Rank 3] totoal_tokens=48727, outputs='B'
-[2024-08-03 15:23:34] [Rank 1] totoal_tokens=50737, outputs='B'
-[2024-08-03 15:23:34] [Rank 2] totoal_tokens=50722, outputs='A'
-[2024-08-03 15:23:35] [Rank 0] totoal_tokens=50117, outputs='B'
-[2024-08-03 15:23:36] [Rank 3] totoal_tokens=48969, outputs='A'
-[2024-08-03 15:23:37] [Rank 1] totoal_tokens=50897, outputs='A'
-[2024-08-03 15:23:38] [Rank 2] totoal_tokens=50996, outputs='A'
-[2024-08-03 15:23:38] [Rank 0] totoal_tokens=50123, outputs='A'
-[2024-08-03 15:23:40] [Rank 3] totoal_tokens=49475, outputs='A'
-[2024-08-03 15:23:41] [Rank 1] totoal_tokens=51037, outputs='A'
-[2024-08-03 15:23:42] [Rank 0] totoal_tokens=50206, outputs='A'
-[2024-08-03 15:23:42] [Rank 2] totoal_tokens=51085, outputs='A'
-[2024-08-03 15:23:43] [Rank 3] totoal_tokens=49994, outputs='A'
-[2024-08-03 15:23:45] [Rank 1] totoal_tokens=51101, outputs='A'
-[2024-08-03 15:23:45] [Rank 2] totoal_tokens=51193, outputs='A'
-[2024-08-03 15:23:47] [Rank 0] totoal_tokens=50254, outputs='A'
-[2024-08-03 15:23:48] [Rank 3] totoal_tokens=50345, outputs='A'
-[2024-08-03 15:23:48] [Rank 1] totoal_tokens=51106, outputs='B'
-[2024-08-03 15:23:49] [Rank 2] totoal_tokens=51306, outputs='B'
-[2024-08-03 15:23:50] [Rank 0] totoal_tokens=50614, outputs='B'
-[2024-08-03 15:23:51] [Rank 3] totoal_tokens=51204, outputs='A'
-[2024-08-03 15:23:51] [Rank 1] totoal_tokens=51123, outputs='B'
-[2024-08-03 15:23:52] [Rank 2] totoal_tokens=51577, outputs='A'
-[2024-08-03 15:23:54] [Rank 0] totoal_tokens=50712, outputs='A'
-[2024-08-03 15:23:54] [Rank 3] totoal_tokens=51204, outputs='A'
-[2024-08-03 15:23:55] [Rank 1] totoal_tokens=51347, outputs='B'
-[2024-08-03 15:23:55] [Rank 2] totoal_tokens=51635, outputs='A'
-[2024-08-03 15:23:58] [Rank 0] totoal_tokens=50888, outputs='A'
-[2024-08-03 15:23:58] [Rank 3] totoal_tokens=51829, outputs='A'
-[2024-08-03 15:23:58] [Rank 1] totoal_tokens=51515, outputs='A'
-[2024-08-03 15:23:59] [Rank 2] totoal_tokens=51743, outputs='A'
-[2024-08-03 15:24:01] [Rank 0] totoal_tokens=51688, outputs='B'
-rnVL2-2B_reasoning-image-test.jsonl:  82%|████████▏ | 601/734 [10:17<06:48,  3.07s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  82%|████████▏ | 602/734 [10:20<06:43,  3.05s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  82%|████████▏ | 603/734 [10:23<06:49,  3.12s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  82%|████████▏ | 604/734 [10:26<06:48,  3.15s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  82%|████████▏ | 605/734 [10:32<08:23,  3.91s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  83%|████████▎ | 606/734 [10:35<07:48,  3.66s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  83%|████████▎ | 607/734 [10:38<07:22,  3.49s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  83%|████████▎ | 608/734 [10:42<07:47,  3.71s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  83%|███████�[2024-08-03 15:24:01] [Rank 3] totoal_tokens=52215, outputs='A'
-[2024-08-03 15:24:01] [Rank 1] totoal_tokens=51806, outputs='A'
-[2024-08-03 15:24:02] [Rank 2] totoal_tokens=51972, outputs='B'
-[2024-08-03 15:24:05] [Rank 3] totoal_tokens=52454, outputs='A'
-[2024-08-03 15:24:05] [Rank 1] totoal_tokens=51905, outputs='A'
-[2024-08-03 15:24:05] [Rank 0] totoal_tokens=52472, outputs='A'
-[2024-08-03 15:24:05] [Rank 2] totoal_tokens=52079, outputs='A'
-[2024-08-03 15:24:08] [Rank 3] totoal_tokens=52971, outputs='B'
-[2024-08-03 15:24:09] [Rank 0] totoal_tokens=52495, outputs='B'
-[2024-08-03 15:24:09] [Rank 1] totoal_tokens=52007, outputs='A'
-[2024-08-03 15:24:09] [Rank 2] totoal_tokens=52192, outputs='B'
-[2024-08-03 15:24:11] [Rank 3] totoal_tokens=53136, outputs='B'
-[2024-08-03 15:24:12] [Rank 1] totoal_tokens=52063, outputs='A'
-[2024-08-03 15:24:13] [Rank 0] totoal_tokens=52538, outputs='A'
-[2024-08-03 15:24:14] [Rank 2] totoal_tokens=52282, outputs='A'
-[2024-08-03 15:24:15] [Rank 3] totoal_tokens=53288, outputs='B'
-[2024-08-03 15:24:16] [Rank 1] totoal_tokens=52342, outputs='B'
-[2024-08-03 15:24:16] [Rank 0] totoal_tokens=52676, outputs='B'
-[2024-08-03 15:24:17] [Rank 2] totoal_tokens=52723, outputs='B'
-[2024-08-03 15:24:19] [Rank 1] totoal_tokens=52605, outputs='B'
-[2024-08-03 15:24:19] [Rank 3] totoal_tokens=53479, outputs='A'
-[2024-08-03 15:24:20] [Rank 0] totoal_tokens=53138, outputs='A'
-[2024-08-03 15:24:20] [Rank 2] totoal_tokens=53800, outputs='A'
-[2024-08-03 15:24:24] [Rank 1] totoal_tokens=53141, outputs='A'
-[2024-08-03 15:24:24] [Rank 0] totoal_tokens=53180, outputs='B'
-[2024-08-03 15:24:25] [Rank 3] totoal_tokens=54144, outputs='A'
-[2024-08-03 15:24:26] [Rank 2] totoal_tokens=53816, outputs='A'
-[2024-08-03 15:24:27] [Rank 0] totoal_tokens=53184, outputs='B'
-[2024-08-03 15:24:28] [Rank 1] totoal_tokens=53338, outputs='B. right'
-[2024-08-03 15:24:28] [Rank 3] totoal_tokens=54150, outputs='B'
-[2024-08-03 15:24:29] [Rank 2] totoal_tokens=53861, outputs='B'
-[2024-08-03 15:24:31] [Rank 0] totoal_tokens=54112, outputs='B'
-[2024-08-03 15:24:31] [Rank 1] totoal_tokens=54084, outputs='A'
-[2024-08-03 15:24:31] [Rank 3] totoal_tokens=54160, outputs='B'
-[2024-08-03 15:24:32] [Rank 2] totoal_tokens=54201, outputs='A'
-[2024-08-03 15:24:35] [Rank 0] totoal_tokens=54125, outputs='A'
-��▎ | 609/734 [10:45<07:24,  3.56s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  83%|████████▎ | 610/734 [10:50<07:47,  3.77s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  83%|████████▎ | 611/734 [10:53<07:43,  3.77s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  83%|████████▎ | 612/734 [10:57<07:44,  3.81s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  84%|████████▎ | 613/734 [11:01<07:18,  3.62s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  84%|████████▎ | 614/734 [11:05<07:43,  3.86s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  84%|████████▍ | 615/734 [11:08<07:16,  3.67s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  84%|████████▍ | 616/734 [11:12<07:09,  3.64s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  84%|████████▍ | 617/734 [11:16<07:13,  3.71s/it]Processing InternVL2-2B[2024-08-03 15:24:35] [Rank 1] totoal_tokens=54144, outputs='A'
-[2024-08-03 15:24:35] [Rank 3] totoal_tokens=54176, outputs='B'
-[2024-08-03 15:24:36] [Rank 2] totoal_tokens=54330, outputs='B'
-[2024-08-03 15:24:38] [Rank 0] totoal_tokens=54458, outputs='B'
-[2024-08-03 15:24:39] [Rank 3] totoal_tokens=54327, outputs='A'
-[2024-08-03 15:24:39] [Rank 1] totoal_tokens=54224, outputs='B. right'
-[2024-08-03 15:24:39] [Rank 2] totoal_tokens=54454, outputs='A'
-[2024-08-03 15:24:42] [Rank 0] totoal_tokens=54534, outputs='A'
-[2024-08-03 15:24:43] [Rank 3] totoal_tokens=54365, outputs='A'
-[2024-08-03 15:24:43] [Rank 1] totoal_tokens=54308, outputs='B'
-[2024-08-03 15:24:44] [Rank 2] totoal_tokens=55401, outputs='A'
-[2024-08-03 15:24:46] [Rank 1] totoal_tokens=54410, outputs='A'
-[2024-08-03 15:24:46] [Rank 3] totoal_tokens=54385, outputs='A'
-[2024-08-03 15:24:48] [Rank 0] totoal_tokens=54630, outputs='A'
-[2024-08-03 15:24:48] [Rank 2] totoal_tokens=55559, outputs='A'
-[2024-08-03 15:24:50] [Rank 1] totoal_tokens=54916, outputs='B'
-[2024-08-03 15:24:50] [Rank 3] totoal_tokens=54390, outputs='A'
-[2024-08-03 15:24:51] [Rank 0] totoal_tokens=54681, outputs='A'
-[2024-08-03 15:24:53] [Rank 2] totoal_tokens=55672, outputs='B'
-[2024-08-03 15:24:53] [Rank 3] totoal_tokens=54500, outputs='A'
-[2024-08-03 15:24:53] [Rank 1] totoal_tokens=55062, outputs='A'
-[2024-08-03 15:24:55] [Rank 0] totoal_tokens=54841, outputs='A'
-[2024-08-03 15:24:56] [Rank 2] totoal_tokens=55825, outputs='A'
-[2024-08-03 15:24:57] [Rank 3] totoal_tokens=54516, outputs='B'
-[2024-08-03 15:24:59] [Rank 1] totoal_tokens=55190, outputs='A'
-[2024-08-03 15:24:59] [Rank 0] totoal_tokens=55342, outputs='B'
-[2024-08-03 15:25:00] [Rank 2] totoal_tokens=56177, outputs='B'
-[2024-08-03 15:25:01] [Rank 3] totoal_tokens=55069, outputs='A'
-[2024-08-03 15:25:03] [Rank 0] totoal_tokens=55982, outputs='A'
-[2024-08-03 15:25:04] [Rank 2] totoal_tokens=56261, outputs='B'
-[2024-08-03 15:25:04] [Rank 1] totoal_tokens=55190, outputs='A'
-[2024-08-03 15:25:04] [Rank 3] totoal_tokens=55301, outputs='A'
-[2024-08-03 15:25:07] [Rank 0] totoal_tokens=56034, outputs='A'
-_reasoning-image-test.jsonl:  84%|████████▍ | 618/734 [11:19<07:05,  3.67s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  84%|████████▍ | 619/734 [11:23<06:53,  3.60s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  84%|████████▍ | 620/734 [11:27<07:00,  3.69s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  85%|████████▍ | 621/734 [11:32<08:05,  4.30s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  85%|████████▍ | 622/734 [11:36<07:39,  4.10s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  85%|████████▍ | 623/734 [11:39<07:15,  3.93s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  85%|████████▌ | 624/734 [11:43<07:16,  3.97s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  85%|████████▌ | 625/734 [11:47<07:07,  3.93s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  85%|████████▌ | [2024-08-03 15:25:07] [Rank 2] totoal_tokens=56451, outputs='A'
-[2024-08-03 15:25:07] [Rank 1] totoal_tokens=55401, outputs='A'
-[2024-08-03 15:25:08] [Rank 3] totoal_tokens=55310, outputs='B'
-[2024-08-03 15:25:12] [Rank 3] totoal_tokens=55493, outputs='B'
-[2024-08-03 15:25:12] [Rank 1] totoal_tokens=56170, outputs='A'
-[2024-08-03 15:25:13] [Rank 2] totoal_tokens=56637, outputs='B. right'
-[2024-08-03 15:25:13] [Rank 0] totoal_tokens=56048, outputs='A'
-[2024-08-03 15:25:16] [Rank 3] totoal_tokens=55562, outputs='B'
-[2024-08-03 15:25:16] [Rank 1] totoal_tokens=56431, outputs='B'
-[2024-08-03 15:25:16] [Rank 2] totoal_tokens=56815, outputs='B'
-[2024-08-03 15:25:17] [Rank 0] totoal_tokens=56203, outputs='B'
-[2024-08-03 15:25:19] [Rank 3] totoal_tokens=55918, outputs='B'
-[2024-08-03 15:25:20] [Rank 1] totoal_tokens=56587, outputs='B'
-[2024-08-03 15:25:20] [Rank 0] totoal_tokens=56259, outputs='B'
-[2024-08-03 15:25:20] [Rank 2] totoal_tokens=56983, outputs='A'
-[2024-08-03 15:25:23] [Rank 3] totoal_tokens=56407, outputs='A'
-[2024-08-03 15:25:24] [Rank 0] totoal_tokens=56291, outputs='A'
-[2024-08-03 15:25:24] [Rank 1] totoal_tokens=56906, outputs='A'
-[2024-08-03 15:25:26] [Rank 2] totoal_tokens=57017, outputs='A'
-[2024-08-03 15:25:26] [Rank 3] totoal_tokens=57375, outputs='B'
-[2024-08-03 15:25:27] [Rank 0] totoal_tokens=56512, outputs='A'
-[2024-08-03 15:25:27] [Rank 1] totoal_tokens=56941, outputs='B'
-[2024-08-03 15:25:30] [Rank 2] totoal_tokens=58064, outputs='A'
-[2024-08-03 15:25:30] [Rank 3] totoal_tokens=57523, outputs='B'
-[2024-08-03 15:25:31] [Rank 1] totoal_tokens=57045, outputs='B'
-[2024-08-03 15:25:31] [Rank 0] totoal_tokens=56514, outputs='A'
-[2024-08-03 15:25:34] [Rank 3] totoal_tokens=57707, outputs='B'
-[2024-08-03 15:25:34] [Rank 2] totoal_tokens=58354, outputs='B'
-[2024-08-03 15:25:35] [Rank 1] totoal_tokens=57362, outputs='B'
-[2024-08-03 15:25:35] [Rank 0] totoal_tokens=56893, outputs='A'
-[2024-08-03 15:25:38] [Rank 3] totoal_tokens=57721, outputs='A'
-[2024-08-03 15:25:38] [Rank 1] totoal_tokens=57607, outputs='B'
-[2024-08-03 15:25:38] [Rank 2] totoal_tokens=58360, outputs='A'
-[2024-08-03 15:25:39] [Rank 0] totoal_tokens=57154, outputs='A'
-[2024-08-03 15:25:41] [Rank 3] totoal_tokens=57808, outputs='B'
-[2024-08-03 15:25:42] [Rank 1] totoal_tokens=57991, outputs='B. right'
-[2024-08-03 15:25:43] [Rank 0] totoal_tokens=57657, outputs='B. right'
-626/734 [11:51<07:09,  3.98s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  85%|████████▌ | 627/734 [11:58<08:16,  4.64s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  86%|████████▌ | 628/734 [12:01<07:37,  4.32s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  86%|████████▌ | 629/734 [12:05<07:04,  4.05s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  86%|████████▌ | 630/734 [12:08<06:47,  3.92s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  86%|████████▌ | 631/734 [12:12<06:32,  3.81s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  86%|████████▌ | 632/734 [12:16<06:31,  3.84s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  86%|████████▌ | 633/734 [12:19<06:24,  3.80s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  86%|████████▋ | 634/734 [12:23<06:16,  3.77s/it]Processing InternVL2-2B_reasoni[2024-08-03 15:25:45] [Rank 2] totoal_tokens=58369, outputs='A'
-[2024-08-03 15:25:45] [Rank 3] totoal_tokens=57945, outputs='A'
-[2024-08-03 15:25:47] [Rank 1] totoal_tokens=58176, outputs='A'
-[2024-08-03 15:25:47] [Rank 0] totoal_tokens=58356, outputs='B'
-[2024-08-03 15:25:49] [Rank 2] totoal_tokens=58728, outputs='B. right'
-[2024-08-03 15:25:50] [Rank 3] totoal_tokens=58053, outputs='A'
-[2024-08-03 15:25:51] [Rank 1] totoal_tokens=58280, outputs='A'
-[2024-08-03 15:25:52] [Rank 0] totoal_tokens=58386, outputs='A'
-[2024-08-03 15:25:53] [Rank 3] totoal_tokens=58392, outputs='B'
-[2024-08-03 15:25:53] [Rank 2] totoal_tokens=58880, outputs='B'
-[2024-08-03 15:25:56] [Rank 1] totoal_tokens=59181, outputs='B'
-[2024-08-03 15:25:57] [Rank 0] totoal_tokens=58429, outputs='A'
-[2024-08-03 15:25:57] [Rank 2] totoal_tokens=58894, outputs='B'
-[2024-08-03 15:25:57] [Rank 3] totoal_tokens=58411, outputs='B'
-[2024-08-03 15:26:00] [Rank 1] totoal_tokens=59592, outputs='B'
-[2024-08-03 15:26:01] [Rank 0] totoal_tokens=58666, outputs='B'
-[2024-08-03 15:26:01] [Rank 2] totoal_tokens=59087, outputs='B'
-[2024-08-03 15:26:01] [Rank 3] totoal_tokens=58479, outputs='B'
-[2024-08-03 15:26:04] [Rank 1] totoal_tokens=59692, outputs='B'
-[2024-08-03 15:26:05] [Rank 0] totoal_tokens=58874, outputs='A'
-[2024-08-03 15:26:05] [Rank 3] totoal_tokens=59191, outputs='B'
-[2024-08-03 15:26:06] [Rank 2] totoal_tokens=59181, outputs='B'
-[2024-08-03 15:26:08] [Rank 1] totoal_tokens=59844, outputs='B'
-[2024-08-03 15:26:09] [Rank 0] totoal_tokens=59103, outputs='B'
-[2024-08-03 15:26:11] [Rank 2] totoal_tokens=59612, outputs='A'
-[2024-08-03 15:26:11] [Rank 3] totoal_tokens=59378, outputs='A'
-[2024-08-03 15:26:13] [Rank 1] totoal_tokens=59967, outputs='A'
-[2024-08-03 15:26:13] [Rank 0] totoal_tokens=59324, outputs='B'
-[2024-08-03 15:26:15] [Rank 3] totoal_tokens=59422, outputs='A'
-[2024-08-03 15:26:16] [Rank 2] totoal_tokens=59868, outputs='A'
-[2024-08-03 15:26:17] [Rank 1] totoal_tokens=60035, outputs='A'
-[2024-08-03 15:26:19] [Rank 0] totoal_tokens=59519, outputs='B'
-ng-image-test.jsonl:  87%|████████▋ | 635/734 [12:28<06:34,  3.98s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  87%|████████▋ | 636/734 [12:32<06:33,  4.02s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  87%|████████▋ | 637/734 [12:37<06:59,  4.32s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  87%|████████▋ | 638/734 [12:41<07:08,  4.46s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  87%|████████▋ | 639/734 [12:45<06:45,  4.27s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  87%|████████▋ | 640/734 [12:49<06:31,  4.17s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  87%|████████▋ | 641/734 [12:53<06:21,  4.10s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  87%|████████▋ | 642/734 [12:58<06:31,  4.26s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  88%|████████▊ | 643/734 [2024-08-03 15:26:19] [Rank 3] totoal_tokens=59494, outputs='B'
-[2024-08-03 15:26:20] [Rank 2] totoal_tokens=60254, outputs='B'
-[2024-08-03 15:26:21] [Rank 1] totoal_tokens=60048, outputs='B'
-[2024-08-03 15:26:23] [Rank 0] totoal_tokens=59656, outputs='B'
-[2024-08-03 15:26:23] [Rank 3] totoal_tokens=60028, outputs='A'
-[2024-08-03 15:26:24] [Rank 2] totoal_tokens=60302, outputs='A'
-[2024-08-03 15:26:25] [Rank 1] totoal_tokens=60307, outputs='A'
-[2024-08-03 15:26:27] [Rank 3] totoal_tokens=60038, outputs='B'
-[2024-08-03 15:26:28] [Rank 2] totoal_tokens=60311, outputs='B'
-[2024-08-03 15:26:28] [Rank 1] totoal_tokens=60390, outputs='B'
-[2024-08-03 15:26:29] [Rank 0] totoal_tokens=59913, outputs='B'
-[2024-08-03 15:26:32] [Rank 1] totoal_tokens=60676, outputs='B'
-[2024-08-03 15:26:33] [Rank 0] totoal_tokens=60324, outputs='B'
-[2024-08-03 15:26:33] [Rank 2] totoal_tokens=60372, outputs='A'
-[2024-08-03 15:26:34] [Rank 3] totoal_tokens=60235, outputs='A'
-[2024-08-03 15:26:37] [Rank 2] totoal_tokens=60377, outputs='B'
-[2024-08-03 15:26:38] [Rank 3] totoal_tokens=60497, outputs='A'
-[2024-08-03 15:26:39] [Rank 0] totoal_tokens=60440, outputs='A'
-[2024-08-03 15:26:39] [Rank 1] totoal_tokens=61039, outputs='A'
-[2024-08-03 15:26:41] [Rank 2] totoal_tokens=60645, outputs='B'
-[2024-08-03 15:26:42] [Rank 3] totoal_tokens=60828, outputs='B'
-[2024-08-03 15:26:42] [Rank 0] totoal_tokens=60451, outputs='A'
-[2024-08-03 15:26:43] [Rank 1] totoal_tokens=61088, outputs='A'
-[2024-08-03 15:26:46] [Rank 2] totoal_tokens=60759, outputs='A'
-[2024-08-03 15:26:47] [Rank 3] totoal_tokens=61394, outputs='B. right'
-[2024-08-03 15:26:47] [Rank 0] totoal_tokens=60871, outputs='A'
-[2024-08-03 15:26:47] [Rank 1] totoal_tokens=61183, outputs='B'
-[2024-08-03 15:26:50] [Rank 2] totoal_tokens=60967, outputs='B'
-[2024-08-03 15:26:51] [Rank 0] totoal_tokens=60993, outputs='B'
-[2024-08-03 15:26:51] [Rank 3] totoal_tokens=61819, outputs='A'
-[2024-08-03 15:26:51] [Rank 1] totoal_tokens=61238, outputs='A'
-[2024-08-03 15:26:53] [Rank 2] totoal_tokens=61024, outputs='B'
-[2024-08-03 15:26:55] [Rank 1] totoal_tokens=61348, outputs='B'
-[2024-08-03 15:26:57] [Rank 0] totoal_tokens=61163, outputs='A'
-[2024-08-03 15:26:57] [Rank 3] totoal_tokens=61835, outputs='A'
-[2024-08-03 15:26:57] [Rank 2] totoal_tokens=61357, outputs='A'
-[2024-08-03 15:27:00] [Rank 1] totoal_tokens=61379, outputs='A'
-[2024-08-03 15:27:00] [Rank 0] totoal_tokens=61337, outputs='B'
-[13:03<06:54,  4.55s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  88%|████████▊ | 644/734 [13:08<06:49,  4.55s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  88%|████████▊ | 645/734 [13:13<07:16,  4.90s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  88%|████████▊ | 646/734 [13:17<06:40,  4.55s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  88%|████████▊ | 647/734 [13:23<07:13,  4.98s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  88%|████████▊ | 648/734 [13:27<06:40,  4.66s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  88%|████████▊ | 649/734 [13:31<06:25,  4.54s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  89%|████████▊ | 650/734 [13:35<06:09,  4.40s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  89%|████████▊ | 651/734 [13:41<06:39,  4.82s/it]Processing InternVL2-2B_reasoning-image[2024-08-03 15:27:01] [Rank 3] totoal_tokens=62281, outputs='B'
-[2024-08-03 15:27:02] [Rank 2] totoal_tokens=61483, outputs='B'
-[2024-08-03 15:27:04] [Rank 1] totoal_tokens=61411, outputs='A'
-[2024-08-03 15:27:04] [Rank 0] totoal_tokens=61603, outputs='B'
-[2024-08-03 15:27:06] [Rank 3] totoal_tokens=62464, outputs='A'
-[2024-08-03 15:27:06] [Rank 2] totoal_tokens=61713, outputs='B'
-[2024-08-03 15:27:09] [Rank 1] totoal_tokens=62064, outputs='A'
-[2024-08-03 15:27:09] [Rank 0] totoal_tokens=61683, outputs='B. right'
-[2024-08-03 15:27:12] [Rank 2] totoal_tokens=61986, outputs='A'
-[2024-08-03 15:27:12] [Rank 3] totoal_tokens=63576, outputs='A'
-[2024-08-03 15:27:13] [Rank 1] totoal_tokens=62247, outputs='A'
-[2024-08-03 15:27:13] [Rank 0] totoal_tokens=62522, outputs='A'
-[2024-08-03 15:27:16] [Rank 3] totoal_tokens=63733, outputs='B'
-[2024-08-03 15:27:16] [Rank 2] totoal_tokens=62321, outputs='A'
-[2024-08-03 15:27:17] [Rank 1] totoal_tokens=62954, outputs='B'
-[2024-08-03 15:27:18] [Rank 0] totoal_tokens=62891, outputs='A'
-[2024-08-03 15:27:20] [Rank 3] totoal_tokens=63759, outputs='B'
-[2024-08-03 15:27:20] [Rank 2] totoal_tokens=63248, outputs='B'
-[2024-08-03 15:27:22] [Rank 1] totoal_tokens=63346, outputs='A'
-[2024-08-03 15:27:23] [Rank 0] totoal_tokens=62972, outputs='A'
-[2024-08-03 15:27:24] [Rank 3] totoal_tokens=64055, outputs='B'
-[2024-08-03 15:27:25] [Rank 2] totoal_tokens=63576, outputs='A'
-[2024-08-03 15:27:26] [Rank 1] totoal_tokens=63351, outputs='B'
-[2024-08-03 15:27:29] [Rank 2] totoal_tokens=63670, outputs='A'
-[2024-08-03 15:27:30] [Rank 0] totoal_tokens=63272, outputs='A'
-[2024-08-03 15:27:30] [Rank 3] totoal_tokens=64249, outputs='A'
-[2024-08-03 15:27:30] [Rank 1] totoal_tokens=63358, outputs='B'
-[2024-08-03 15:27:34] [Rank 2] totoal_tokens=63886, outputs='A'
-[2024-08-03 15:27:34] [Rank 0] totoal_tokens=63288, outputs='A'
-[2024-08-03 15:27:36] [Rank 3] totoal_tokens=64259, outputs='A'
-[2024-08-03 15:27:36] [Rank 1] totoal_tokens=63435, outputs='B'
-[2024-08-03 15:27:39] [Rank 2] totoal_tokens=63913, outputs='A'
-[2024-08-03 15:27:39] [Rank 0] totoal_tokens=63305, outputs='A'
--test.jsonl:  89%|████████▉ | 652/734 [13:45<06:11,  4.53s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  89%|████████▉ | 653/734 [13:49<05:51,  4.34s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  89%|████████▉ | 654/734 [13:54<05:59,  4.50s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  89%|████████▉ | 655/734 [13:58<05:42,  4.34s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  89%|████████▉ | 656/734 [14:03<05:54,  4.55s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  90%|████████▉ | 657/734 [14:07<05:55,  4.62s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  90%|████████▉ | 658/734 [14:14<06:40,  5.26s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  90%|████████▉ | 659/734 [14:19<06:22,  5.10s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  90%|████████▉ | 660/734 [14:23<0[2024-08-03 15:27:40] [Rank 3] totoal_tokens=64347, outputs='A'
-[2024-08-03 15:27:42] [Rank 1] totoal_tokens=63712, outputs='A'
-[2024-08-03 15:27:43] [Rank 0] totoal_tokens=63485, outputs='B'
-[2024-08-03 15:27:44] [Rank 2] totoal_tokens=64199, outputs='A'
-[2024-08-03 15:27:45] [Rank 3] totoal_tokens=64368, outputs='A'
-[2024-08-03 15:27:46] [Rank 1] totoal_tokens=63766, outputs='A'
-[2024-08-03 15:27:47] [Rank 0] totoal_tokens=63575, outputs='A'
-[2024-08-03 15:27:49] [Rank 3] totoal_tokens=64459, outputs='A'
-[2024-08-03 15:27:50] [Rank 2] totoal_tokens=64307, outputs='A'
-[2024-08-03 15:27:50] [Rank 1] totoal_tokens=64227, outputs='B'
-[2024-08-03 15:27:51] [Rank 0] totoal_tokens=63655, outputs='B'
-[2024-08-03 15:27:54] [Rank 3] totoal_tokens=64563, outputs='A'
-[2024-08-03 15:27:55] [Rank 2] totoal_tokens=64531, outputs='A'
-[2024-08-03 15:27:55] [Rank 1] totoal_tokens=64238, outputs='A'
-[2024-08-03 15:27:56] [Rank 0] totoal_tokens=63697, outputs='A'
-[2024-08-03 15:27:58] [Rank 3] totoal_tokens=64625, outputs='A'
-[2024-08-03 15:28:00] [Rank 1] totoal_tokens=64699, outputs='B'
-[2024-08-03 15:28:00] [Rank 0] totoal_tokens=63736, outputs='A'
-[2024-08-03 15:28:01] [Rank 2] totoal_tokens=64723, outputs='A'
-[2024-08-03 15:28:02] [Rank 3] totoal_tokens=64925, outputs='B'
-[2024-08-03 15:28:04] [Rank 0] totoal_tokens=63743, outputs='B'
-[2024-08-03 15:28:05] [Rank 1] totoal_tokens=64762, outputs='A'
-[2024-08-03 15:28:05] [Rank 2] totoal_tokens=65106, outputs='A'
-[2024-08-03 15:28:07] [Rank 3] totoal_tokens=65079, outputs='A'
-[2024-08-03 15:28:09] [Rank 0] totoal_tokens=63761, outputs='A'
-[2024-08-03 15:28:10] [Rank 1] totoal_tokens=64916, outputs='A'
-[2024-08-03 15:28:10] [Rank 2] totoal_tokens=65173, outputs='A'
-[2024-08-03 15:28:12] [Rank 3] totoal_tokens=65128, outputs='A'
-[2024-08-03 15:28:13] [Rank 0] totoal_tokens=64452, outputs='A'
-[2024-08-03 15:28:14] [Rank 1] totoal_tokens=65216, outputs='A'
-[2024-08-03 15:28:14] [Rank 2] totoal_tokens=65639, outputs='B'
-[2024-08-03 15:28:18] [Rank 0] totoal_tokens=64582, outputs='B'
-6:01,  4.89s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  90%|█████████ | 661/734 [14:28<05:48,  4.77s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  90%|█████████ | 662/734 [14:32<05:29,  4.58s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  90%|█████████ | 663/734 [14:36<05:12,  4.39s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  90%|█████████ | 664/734 [14:40<05:01,  4.30s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  91%|█████████ | 665/734 [14:44<04:58,  4.33s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  91%|█████████ | 666/734 [14:49<04:51,  4.29s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  91%|█████████ | 667/734 [14:53<04:55,  4.41s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  91%|█████████ | 668/734 [14:58<04:53,  4.44s/it]Processing InternVL2-2B_reasoning-image-test.js[2024-08-03 15:28:18] [Rank 1] totoal_tokens=65356, outputs='A'
-[2024-08-03 15:28:19] [Rank 2] totoal_tokens=65652, outputs='B'
-[2024-08-03 15:28:19] [Rank 3] totoal_tokens=65722, outputs='B'
-[2024-08-03 15:28:23] [Rank 1] totoal_tokens=65633, outputs='A'
-[2024-08-03 15:28:23] [Rank 0] totoal_tokens=64829, outputs='B. right'
-[2024-08-03 15:28:24] [Rank 3] totoal_tokens=65730, outputs='A'
-[2024-08-03 15:28:24] [Rank 2] totoal_tokens=65746, outputs='B'
-[2024-08-03 15:28:27] [Rank 1] totoal_tokens=66161, outputs='B'
-[2024-08-03 15:28:28] [Rank 0] totoal_tokens=64841, outputs='A'
-[2024-08-03 15:28:28] [Rank 3] totoal_tokens=65891, outputs='A'
-[2024-08-03 15:28:29] [Rank 2] totoal_tokens=65930, outputs='B'
-[2024-08-03 15:28:33] [Rank 3] totoal_tokens=65971, outputs='B. right'
-[2024-08-03 15:28:33] [Rank 0] totoal_tokens=65223, outputs='A'
-[2024-08-03 15:28:33] [Rank 1] totoal_tokens=66505, outputs='A'
-[2024-08-03 15:28:33] [Rank 2] totoal_tokens=66071, outputs='B'
-[2024-08-03 15:28:38] [Rank 3] totoal_tokens=65979, outputs='A'
-[2024-08-03 15:28:38] [Rank 1] totoal_tokens=66574, outputs='A'
-[2024-08-03 15:28:38] [Rank 0] totoal_tokens=65281, outputs='A'
-[2024-08-03 15:28:39] [Rank 2] totoal_tokens=66139, outputs='B. right'
-[2024-08-03 15:28:43] [Rank 1] totoal_tokens=66694, outputs='B. right'
-[2024-08-03 15:28:43] [Rank 0] totoal_tokens=65779, outputs='A'
-[2024-08-03 15:28:44] [Rank 2] totoal_tokens=66157, outputs='A'
-[2024-08-03 15:28:44] [Rank 3] totoal_tokens=67020, outputs='A'
-[2024-08-03 15:28:48] [Rank 0] totoal_tokens=65784, outputs='B. right'
-[2024-08-03 15:28:48] [Rank 1] totoal_tokens=67121, outputs='B. right'
-[2024-08-03 15:28:49] [Rank 2] totoal_tokens=66180, outputs='A'
-[2024-08-03 15:28:49] [Rank 3] totoal_tokens=67143, outputs='B'
-[2024-08-03 15:28:53] [Rank 0] totoal_tokens=65940, outputs='B'
-[2024-08-03 15:28:53] [Rank 1] totoal_tokens=67309, outputs='A'
-[2024-08-03 15:28:53] [Rank 2] totoal_tokens=66197, outputs='A'
-[2024-08-03 15:28:54] [Rank 3] totoal_tokens=67295, outputs='B. right'
-[2024-08-03 15:28:57] [Rank 0] totoal_tokens=66020, outputs='B'
-onl:  91%|█████████ | 669/734 [15:02<04:49,  4.45s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  91%|█████████▏| 670/734 [15:08<05:03,  4.74s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  91%|█████████▏| 671/734 [15:12<04:51,  4.62s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  92%|█████████▏| 672/734 [15:17<04:58,  4.81s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  92%|█████████▏| 673/734 [15:23<05:08,  5.06s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  92%|█████████▏| 674/734 [15:28<04:59,  5.00s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  92%|█████████▏| 675/734 [15:32<04:45,  4.83s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  92%|█████████▏| 676/734 [15:37<04:40,  4.83s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  92%|█████████▏| 677/734 [2024-08-03 15:28:58] [Rank 1] totoal_tokens=67429, outputs='B'
-[2024-08-03 15:28:59] [Rank 3] totoal_tokens=67780, outputs='A'
-[2024-08-03 15:28:59] [Rank 2] totoal_tokens=66233, outputs='A'
-[2024-08-03 15:29:01] [Rank 0] totoal_tokens=66298, outputs='B'
-[2024-08-03 15:29:03] [Rank 1] totoal_tokens=67551, outputs='A'
-[2024-08-03 15:29:04] [Rank 3] totoal_tokens=67993, outputs='A'
-[2024-08-03 15:29:04] [Rank 2] totoal_tokens=66261, outputs='A'
-[2024-08-03 15:29:07] [Rank 0] totoal_tokens=66567, outputs='B'
-[2024-08-03 15:29:08] [Rank 1] totoal_tokens=67609, outputs='B'
-[2024-08-03 15:29:08] [Rank 3] totoal_tokens=68409, outputs='B'
-[2024-08-03 15:29:08] [Rank 2] totoal_tokens=66611, outputs='A'
-[2024-08-03 15:29:12] [Rank 0] totoal_tokens=66596, outputs='A'
-[2024-08-03 15:29:13] [Rank 1] totoal_tokens=67939, outputs='A'
-[2024-08-03 15:29:14] [Rank 3] totoal_tokens=68440, outputs='B'
-[2024-08-03 15:29:14] [Rank 2] totoal_tokens=66721, outputs='B'
-[2024-08-03 15:29:17] [Rank 0] totoal_tokens=66987, outputs='B. right'
-[2024-08-03 15:29:17] [Rank 1] totoal_tokens=67985, outputs='B'
-[2024-08-03 15:29:18] [Rank 2] totoal_tokens=67422, outputs='A'
-[2024-08-03 15:29:20] [Rank 3] totoal_tokens=68606, outputs='B. right'
-[2024-08-03 15:29:21] [Rank 0] totoal_tokens=67609, outputs='B'
-[2024-08-03 15:29:23] [Rank 1] totoal_tokens=68160, outputs='A'
-[2024-08-03 15:29:23] [Rank 2] totoal_tokens=67499, outputs='B'
-[2024-08-03 15:29:25] [Rank 3] totoal_tokens=68729, outputs='B. right'
-[2024-08-03 15:29:25] [Rank 0] totoal_tokens=68025, outputs='B. right'
-[2024-08-03 15:29:27] [Rank 1] totoal_tokens=68185, outputs='A'
-[2024-08-03 15:29:28] [Rank 2] totoal_tokens=67586, outputs='B'
-[2024-08-03 15:29:29] [Rank 3] totoal_tokens=69278, outputs='B'
-[2024-08-03 15:29:30] [Rank 0] totoal_tokens=68170, outputs='B'
-[2024-08-03 15:29:32] [Rank 1] totoal_tokens=68536, outputs='B'
-[2024-08-03 15:29:33] [Rank 2] totoal_tokens=67682, outputs='B'
-[2024-08-03 15:29:34] [Rank 3] totoal_tokens=69292, outputs='B'
-[2024-08-03 15:29:34] [Rank 0] totoal_tokens=68256, outputs='B. right'
-[2024-08-03 15:29:38] [Rank 2] totoal_tokens=67704, outputs='A'
-[2024-08-03 15:29:38] [Rank 1] totoal_tokens=68585, outputs='B. right'
-[2024-08-03 15:29:39] [Rank 3] totoal_tokens=69619, outputs='B'
-[2024-08-03 15:29:39] [Rank 0] totoal_tokens=68386, outputs='B'
-[15:41<04:27,  4.70s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  92%|█████████▏| 678/734 [15:46<04:19,  4.63s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  93%|█████████▎| 679/734 [15:51<04:23,  4.79s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  93%|█████████▎| 680/734 [15:57<04:30,  5.00s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  93%|█████████▎| 681/734 [16:01<04:20,  4.91s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  93%|█████████▎| 682/734 [16:05<04:05,  4.71s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  93%|█████████▎| 683/734 [16:10<03:55,  4.63s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  93%|█████████▎| 684/734 [16:14<03:49,  4.58s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  93%|█████████▎| 685/734 [16:19<03:43,  4.56s/it]Processing InternVL2-2B[2024-08-03 15:29:42] [Rank 2] totoal_tokens=67732, outputs='B'
-[2024-08-03 15:29:43] [Rank 1] totoal_tokens=69029, outputs='B. right'
-[2024-08-03 15:29:45] [Rank 0] totoal_tokens=68387, outputs='A'
-[2024-08-03 15:29:45] [Rank 3] totoal_tokens=69625, outputs='A'
-[2024-08-03 15:29:47] [Rank 2] totoal_tokens=67790, outputs='A'
-[2024-08-03 15:29:47] [Rank 1] totoal_tokens=69112, outputs='B'
-[2024-08-03 15:29:50] [Rank 0] totoal_tokens=68755, outputs='B'
-[2024-08-03 15:29:51] [Rank 2] totoal_tokens=67963, outputs='A'
-[2024-08-03 15:29:51] [Rank 3] totoal_tokens=69637, outputs='A'
-[2024-08-03 15:29:52] [Rank 1] totoal_tokens=69453, outputs='B. right'
-[2024-08-03 15:29:55] [Rank 0] totoal_tokens=68808, outputs='B'
-[2024-08-03 15:29:56] [Rank 3] totoal_tokens=69893, outputs='B'
-[2024-08-03 15:29:57] [Rank 2] totoal_tokens=68301, outputs='A'
-[2024-08-03 15:29:57] [Rank 1] totoal_tokens=69596, outputs='A'
-[2024-08-03 15:30:01] [Rank 2] totoal_tokens=68322, outputs='A'
-[2024-08-03 15:30:02] [Rank 1] totoal_tokens=69855, outputs='B'
-[2024-08-03 15:30:03] [Rank 3] totoal_tokens=69929, outputs='A'
-[2024-08-03 15:30:03] [Rank 0] totoal_tokens=69707, outputs='A'
-[2024-08-03 15:30:06] [Rank 2] totoal_tokens=69079, outputs='B. right'
-[2024-08-03 15:30:07] [Rank 1] totoal_tokens=69975, outputs='A'
-[2024-08-03 15:30:08] [Rank 0] totoal_tokens=69750, outputs='B. right'
-[2024-08-03 15:30:08] [Rank 3] totoal_tokens=70001, outputs='B'
-[2024-08-03 15:30:12] [Rank 2] totoal_tokens=69536, outputs='A'
-[2024-08-03 15:30:13] [Rank 0] totoal_tokens=69804, outputs='A'
-[2024-08-03 15:30:13] [Rank 1] totoal_tokens=70671, outputs='A'
-[2024-08-03 15:30:13] [Rank 3] totoal_tokens=70161, outputs='A'
-[2024-08-03 15:30:17] [Rank 2] totoal_tokens=70161, outputs='A'
-[2024-08-03 15:30:18] [Rank 0] totoal_tokens=69872, outputs='A'
-[2024-08-03 15:30:18] [Rank 1] totoal_tokens=70803, outputs='A'
-[2024-08-03 15:30:19] [Rank 3] totoal_tokens=70257, outputs='A'
-[2024-08-03 15:30:22] [Rank 2] totoal_tokens=71097, outputs='A'
-[2024-08-03 15:30:23] [Rank 0] totoal_tokens=70187, outputs='B. right'
-_reasoning-image-test.jsonl:  93%|█████████▎| 686/734 [16:23<03:38,  4.56s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  94%|█████████▎| 687/734 [16:29<03:54,  4.99s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  94%|█████████▎| 688/734 [16:34<03:45,  4.89s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  94%|█████████▍| 689/734 [16:39<03:42,  4.95s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  94%|█████████▍| 690/734 [16:47<04:19,  5.90s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  94%|█████████▍| 691/734 [16:52<04:00,  5.59s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  94%|█████████▍| 692/734 [16:57<03:46,  5.38s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  94%|█████████▍| 693/734 [17:02<03:34,  5.23s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  95%|████�[2024-08-03 15:30:23] [Rank 1] totoal_tokens=70805, outputs='A'
-[2024-08-03 15:30:24] [Rank 3] totoal_tokens=70306, outputs='B'
-[2024-08-03 15:30:28] [Rank 2] totoal_tokens=71131, outputs='A'
-[2024-08-03 15:30:28] [Rank 0] totoal_tokens=70227, outputs='A'
-[2024-08-03 15:30:28] [Rank 1] totoal_tokens=71013, outputs='A'
-[2024-08-03 15:30:29] [Rank 3] totoal_tokens=70568, outputs='B. right'
-[2024-08-03 15:30:33] [Rank 2] totoal_tokens=72045, outputs='A'
-[2024-08-03 15:30:33] [Rank 0] totoal_tokens=70562, outputs='A'
-[2024-08-03 15:30:33] [Rank 1] totoal_tokens=71908, outputs='B'
-[2024-08-03 15:30:35] [Rank 3] totoal_tokens=71016, outputs='A'
-[2024-08-03 15:30:38] [Rank 2] totoal_tokens=72121, outputs='A'
-[2024-08-03 15:30:38] [Rank 0] totoal_tokens=70637, outputs='A'
-[2024-08-03 15:30:39] [Rank 1] totoal_tokens=72431, outputs='B'
-[2024-08-03 15:30:40] [Rank 3] totoal_tokens=71190, outputs='A'
-[2024-08-03 15:30:43] [Rank 2] totoal_tokens=72395, outputs='B'
-[2024-08-03 15:30:44] [Rank 0] totoal_tokens=71177, outputs='B. right'
-[2024-08-03 15:30:45] [Rank 1] totoal_tokens=72458, outputs='A'
-[2024-08-03 15:30:45] [Rank 3] totoal_tokens=71190, outputs='A'
-[2024-08-03 15:30:48] [Rank 2] totoal_tokens=72400, outputs='A'
-[2024-08-03 15:30:50] [Rank 0] totoal_tokens=71442, outputs='B. right'
-[2024-08-03 15:30:51] [Rank 1] totoal_tokens=72539, outputs='A'
-[2024-08-03 15:30:52] [Rank 3] totoal_tokens=71454, outputs='A'
-[2024-08-03 15:30:55] [Rank 2] totoal_tokens=72892, outputs='A'
-[2024-08-03 15:30:56] [Rank 0] totoal_tokens=71446, outputs='A'
-[2024-08-03 15:30:56] [Rank 1] totoal_tokens=72602, outputs='B. right'
-[2024-08-03 15:30:58] [Rank 3] totoal_tokens=71538, outputs='A'
-[2024-08-03 15:31:01] [Rank 0] totoal_tokens=71506, outputs='A'
-[2024-08-03 15:31:01] [Rank 2] totoal_tokens=72987, outputs='A'
-[2024-08-03 15:31:01] [Rank 1] totoal_tokens=73070, outputs='A'
-[2024-08-03 15:31:03] [Rank 3] totoal_tokens=71769, outputs='B'
-[2024-08-03 15:31:06] [Rank 1] totoal_tokens=73293, outputs='B. right'
-[2024-08-03 15:31:07] [Rank 2] totoal_tokens=73018, outputs='A'
-[2024-08-03 15:31:07] [Rank 0] totoal_tokens=71579, outputs='A'
-�████▍| 694/734 [17:07<03:30,  5.26s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  95%|█████████▍| 695/734 [17:12<03:22,  5.19s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  95%|█████████▍| 696/734 [17:17<03:14,  5.11s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  95%|█████████▍| 697/734 [17:23<03:15,  5.29s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  95%|█████████▌| 698/734 [17:28<03:11,  5.32s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  95%|█████████▌| 699/734 [17:35<03:18,  5.68s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  95%|█████████▌| 700/734 [17:40<03:07,  5.51s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  96%|█████████▌| 701/734 [17:45<03:00,  5.46s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  96%|█████████▌| 702/734 [17:51<03:01,  5.67s/i[2024-08-03 15:31:08] [Rank 3] totoal_tokens=71961, outputs='A'
-[2024-08-03 15:31:12] [Rank 1] totoal_tokens=73303, outputs='B'
-[2024-08-03 15:31:12] [Rank 0] totoal_tokens=72095, outputs='A'
-[2024-08-03 15:31:12] [Rank 2] totoal_tokens=73166, outputs='B. right'
-[2024-08-03 15:31:14] [Rank 3] totoal_tokens=72147, outputs='A'
-[2024-08-03 15:31:17] [Rank 1] totoal_tokens=73470, outputs='B. right'
-[2024-08-03 15:31:17] [Rank 2] totoal_tokens=73220, outputs='B'
-[2024-08-03 15:31:18] [Rank 0] totoal_tokens=72967, outputs='A'
-[2024-08-03 15:31:19] [Rank 3] totoal_tokens=72534, outputs='B. right'
-[2024-08-03 15:31:23] [Rank 1] totoal_tokens=73838, outputs='A'
-[2024-08-03 15:31:23] [Rank 2] totoal_tokens=73359, outputs='A'
-[2024-08-03 15:31:24] [Rank 0] totoal_tokens=73072, outputs='B. right'
-[2024-08-03 15:31:24] [Rank 3] totoal_tokens=73633, outputs='B'
-[2024-08-03 15:31:28] [Rank 1] totoal_tokens=73886, outputs='A'
-[2024-08-03 15:31:29] [Rank 2] totoal_tokens=73791, outputs='A'
-[2024-08-03 15:31:29] [Rank 0] totoal_tokens=73084, outputs='A'
-[2024-08-03 15:31:30] [Rank 3] totoal_tokens=73956, outputs='B. right'
-[2024-08-03 15:31:35] [Rank 1] totoal_tokens=74144, outputs='A'
-[2024-08-03 15:31:35] [Rank 2] totoal_tokens=73944, outputs='A'
-[2024-08-03 15:31:35] [Rank 3] totoal_tokens=73992, outputs='B'
-[2024-08-03 15:31:35] [Rank 0] totoal_tokens=73214, outputs='B'
-[2024-08-03 15:31:40] [Rank 3] totoal_tokens=74209, outputs='B'
-[2024-08-03 15:31:40] [Rank 2] totoal_tokens=74591, outputs='B'
-[2024-08-03 15:31:40] [Rank 1] totoal_tokens=74184, outputs='A'
-[2024-08-03 15:31:41] [Rank 0] totoal_tokens=74242, outputs='A'
-[2024-08-03 15:31:46] [Rank 1] totoal_tokens=74227, outputs='A'
-[2024-08-03 15:31:46] [Rank 2] totoal_tokens=74722, outputs='A'
-[2024-08-03 15:31:46] [Rank 3] totoal_tokens=74648, outputs='A'
-[2024-08-03 15:31:46] [Rank 0] totoal_tokens=74336, outputs='A'
-[2024-08-03 15:31:52] [Rank 3] totoal_tokens=75490, outputs='B'
-[2024-08-03 15:31:52] [Rank 0] totoal_tokens=74723, outputs='A'
-[2024-08-03 15:31:53] [Rank 1] totoal_tokens=74345, outputs='B. right'
-[2024-08-03 15:31:54] [Rank 2] totoal_tokens=74918, outputs='A'
-[2024-08-03 15:31:58] [Rank 0] totoal_tokens=74755, outputs='C'
-t]Processing InternVL2-2B_reasoning-image-test.jsonl:  96%|█████████▌| 703/734 [17:57<02:51,  5.52s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  96%|█████████▌| 704/734 [18:03<02:50,  5.68s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  96%|█████████▌| 705/734 [18:08<02:42,  5.61s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  96%|█████████▌| 706/734 [18:14<02:36,  5.58s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  96%|█████████▋| 707/734 [18:20<02:33,  5.70s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  96%|█████████▋| 708/734 [18:26<02:30,  5.79s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  97%|█████████▋| 709/734 [18:31<02:20,  5.62s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  97%|█████████▋| 710/734 [18:37<02:17,  5.73s/it]Processing InternVL2-2B_reasoning-image-test.[2024-08-03 15:31:58] [Rank 1] totoal_tokens=74573, outputs='B'
-[2024-08-03 15:31:59] [Rank 3] totoal_tokens=75560, outputs='B'
-[2024-08-03 15:32:00] [Rank 2] totoal_tokens=75193, outputs='B'
-[2024-08-03 15:32:04] [Rank 1] totoal_tokens=74692, outputs='B. right'
-[2024-08-03 15:32:05] [Rank 3] totoal_tokens=75616, outputs='B'
-[2024-08-03 15:32:05] [Rank 0] totoal_tokens=74798, outputs='A'
-[2024-08-03 15:32:05] [Rank 2] totoal_tokens=75208, outputs='A'
-[2024-08-03 15:32:09] [Rank 1] totoal_tokens=76067, outputs='A'
-[2024-08-03 15:32:10] [Rank 0] totoal_tokens=74840, outputs='B'
-[2024-08-03 15:32:11] [Rank 2] totoal_tokens=75337, outputs='A'
-[2024-08-03 15:32:11] [Rank 3] totoal_tokens=75944, outputs='A'
-[2024-08-03 15:32:15] [Rank 1] totoal_tokens=76086, outputs='A'
-[2024-08-03 15:32:16] [Rank 0] totoal_tokens=75019, outputs='B'
-[2024-08-03 15:32:17] [Rank 3] totoal_tokens=75999, outputs='A'
-[2024-08-03 15:32:17] [Rank 2] totoal_tokens=76203, outputs='B. right'
-[2024-08-03 15:32:20] [Rank 1] totoal_tokens=76493, outputs='B'
-[2024-08-03 15:32:22] [Rank 0] totoal_tokens=75641, outputs='A'
-[2024-08-03 15:32:23] [Rank 2] totoal_tokens=76629, outputs='A'
-[2024-08-03 15:32:23] [Rank 3] totoal_tokens=76245, outputs='B. right'
-[2024-08-03 15:32:26] [Rank 1] totoal_tokens=76546, outputs='A'
-[2024-08-03 15:32:27] [Rank 0] totoal_tokens=75741, outputs='B. right'
-[2024-08-03 15:32:29] [Rank 2] totoal_tokens=77153, outputs='B'
-[2024-08-03 15:32:30] [Rank 3] totoal_tokens=76519, outputs='B. right'
-[2024-08-03 15:32:31] [Rank 1] totoal_tokens=76668, outputs='B. right'
-[2024-08-03 15:32:33] [Rank 0] totoal_tokens=76064, outputs='B'
-[2024-08-03 15:32:35] [Rank 2] totoal_tokens=77210, outputs='A'
-[2024-08-03 15:32:37] [Rank 1] totoal_tokens=76902, outputs='B'
-[2024-08-03 15:32:37] [Rank 3] totoal_tokens=76930, outputs='B. right'
-[2024-08-03 15:32:38] [Rank 0] totoal_tokens=76329, outputs='B. right'
-[2024-08-03 15:32:40] [Rank 2] totoal_tokens=77212, outputs='B'
-[2024-08-03 15:32:42] [Rank 3] totoal_tokens=77205, outputs='A'
-[2024-08-03 15:32:43] [Rank 1] totoal_tokens=76945, outputs='B'
-[2024-08-03 15:32:44] [Rank 0] totoal_tokens=76599, outputs='A'
-jsonl:  97%|█████████▋| 711/734 [18:43<02:12,  5.75s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  97%|█████████▋| 712/734 [18:49<02:12,  6.01s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  97%|█████████▋| 713/734 [18:55<02:02,  5.85s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  97%|█████████▋| 714/734 [19:01<01:57,  5.86s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  97%|█████████▋| 715/734 [19:06<01:51,  5.87s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  98%|█████████▊| 716/734 [19:12<01:42,  5.69s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  98%|█████████▊| 717/734 [19:17<01:35,  5.59s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  98%|█████████▊| 718/734 [19:23<01:28,  5.54s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  98%|█████████▊| 719/[2024-08-03 15:32:47] [Rank 2] totoal_tokens=77325, outputs='A'
-[2024-08-03 15:32:48] [Rank 1] totoal_tokens=76945, outputs='B. right'
-[2024-08-03 15:32:49] [Rank 3] totoal_tokens=78029, outputs='A'
-[2024-08-03 15:32:51] [Rank 0] totoal_tokens=76682, outputs='A'
-[2024-08-03 15:32:53] [Rank 2] totoal_tokens=77504, outputs='B'
-[2024-08-03 15:32:54] [Rank 1] totoal_tokens=77078, outputs='B'
-[2024-08-03 15:32:54] [Rank 3] totoal_tokens=78170, outputs='A'
-[2024-08-03 15:32:56] [Rank 0] totoal_tokens=76870, outputs='B'
-[2024-08-03 15:32:58] [Rank 2] totoal_tokens=77598, outputs='B'
-[2024-08-03 15:33:00] [Rank 1] totoal_tokens=77156, outputs='A'
-[2024-08-03 15:33:01] [Rank 3] totoal_tokens=78196, outputs='A'
-[2024-08-03 15:33:02] [Rank 0] totoal_tokens=77087, outputs='B. right'
-[2024-08-03 15:33:06] [Rank 2] totoal_tokens=77689, outputs='A'
-[2024-08-03 15:33:06] [Rank 1] totoal_tokens=78474, outputs='A'
-[2024-08-03 15:33:07] [Rank 0] totoal_tokens=77188, outputs='B. right'
-[2024-08-03 15:33:08] [Rank 3] totoal_tokens=78301, outputs='A'
-[2024-08-03 15:33:12] [Rank 2] totoal_tokens=78228, outputs='A'
-[2024-08-03 15:33:13] [Rank 0] totoal_tokens=77770, outputs='B'
-[2024-08-03 15:33:14] [Rank 1] totoal_tokens=78651, outputs='A'
-[2024-08-03 15:33:14] [Rank 3] totoal_tokens=78451, outputs='A'
-[2024-08-03 15:33:17] [Rank 2] totoal_tokens=78324, outputs='B'
-[2024-08-03 15:33:19] [Rank 3] totoal_tokens=78761, outputs='B'
-[2024-08-03 15:33:20] [Rank 1] totoal_tokens=78885, outputs='A'
-[2024-08-03 15:33:20] [Rank 0] totoal_tokens=78061, outputs='A'
-[2024-08-03 15:33:24] [Rank 2] totoal_tokens=78818, outputs='A'
-[2024-08-03 15:33:25] [Rank 0] totoal_tokens=78287, outputs='B. right'
-[2024-08-03 15:33:25] [Rank 1] totoal_tokens=79058, outputs='B. right'
-[2024-08-03 15:33:26] [Rank 3] totoal_tokens=79027, outputs='B'
-[2024-08-03 15:33:30] [Rank 2] totoal_tokens=78948, outputs='B. right'
-[2024-08-03 15:33:30] [Rank 0] totoal_tokens=78471, outputs='B'
-[2024-08-03 15:33:31] [Rank 1] totoal_tokens=79510, outputs='A'
-[2024-08-03 15:33:32] [Rank 3] totoal_tokens=79164, outputs='A'
-[2024-08-03 15:33:36] [Rank 0] totoal_tokens=78485, outputs='A'
-734 [19:29<01:25,  5.73s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  98%|█████████▊| 720/734 [19:35<01:24,  6.01s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  98%|█████████▊| 721/734 [19:41<01:15,  5.82s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  98%|█████████▊| 722/734 [19:46<01:08,  5.71s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  99%|█████████▊| 723/734 [19:52<01:02,  5.65s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  99%|█████████▊| 724/734 [19:58<00:57,  5.76s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  99%|█████████▉| 725/734 [20:04<00:53,  5.95s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  99%|█████████▉| 726/734 [20:10<00:46,  5.80s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  99%|█████████▉| 727/734 [20:15<00:39,  5.64s/it]Processing InternVL[2024-08-03 15:33:37] [Rank 2] totoal_tokens=79027, outputs='B'
-[2024-08-03 15:33:37] [Rank 1] totoal_tokens=79799, outputs='A'
-[2024-08-03 15:33:38] [Rank 3] totoal_tokens=79242, outputs='A'
-[2024-08-03 15:33:42] [Rank 2] totoal_tokens=79215, outputs='A'
-[2024-08-03 15:33:43] [Rank 0] totoal_tokens=78748, outputs='A'
-[2024-08-03 15:33:44] [Rank 3] totoal_tokens=79265, outputs='A'
-[2024-08-03 15:33:44] [Rank 1] totoal_tokens=79942, outputs='A'
-[2024-08-03 15:33:48] [Rank 2] totoal_tokens=79616, outputs='B'
-[2024-08-03 15:33:49] [Rank 0] totoal_tokens=79004, outputs='A'
-[2024-08-03 15:33:49] [Rank 3] totoal_tokens=79561, outputs='B. right'
-[2024-08-03 15:33:50] [Rank 1] totoal_tokens=79955, outputs='B. right'
-[2024-08-03 15:33:50] Rank 1 Finish
-[2024-08-03 15:33:54] [Rank 0] totoal_tokens=79356, outputs='A'
-[2024-08-03 15:33:55] [Rank 2] totoal_tokens=79693, outputs='A'
-[2024-08-03 15:33:56] [Rank 3] totoal_tokens=79829, outputs='A'
-[2024-08-03 15:34:00] [Rank 0] totoal_tokens=79534, outputs='B. right'
-[2024-08-03 15:34:01] [Rank 2] totoal_tokens=79835, outputs='A'
-[2024-08-03 15:34:01] Rank 2 Finish
-[2024-08-03 15:34:04] [Rank 3] totoal_tokens=79943, outputs='B. right'
-[2024-08-03 15:34:04] Rank 3 Finish
-[2024-08-03 15:34:06] [Rank 0] totoal_tokens=79828, outputs='B. right'
-[2024-08-03 15:34:13] [Rank 0] totoal_tokens=79932, outputs='A'
-2-2B_reasoning-image-test.jsonl:  99%|█████████▉| 728/734 [20:21<00:34,  5.71s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  99%|█████████▉| 729/734 [20:28<00:30,  6.04s/it]Processing InternVL2-2B_reasoning-image-test.jsonl:  99%|█████████▉| 730/734 [20:33<00:23,  5.94s/it]Processing InternVL2-2B_reasoning-image-test.jsonl: 100%|█████████▉| 731/734 [20:39<00:17,  5.86s/it]Processing InternVL2-2B_reasoning-image-test.jsonl: 100%|█████████▉| 732/734 [20:45<00:11,  5.82s/it]Processing InternVL2-2B_reasoning-image-test.jsonl: 100%|█████████▉| 733/734 [20:51<00:05,  5.88s/it]Processing InternVL2-2B_reasoning-image-test.jsonl: 100%|██████████| 734/734 [20:58<00:00,  6.26s/it]Processing InternVL2-2B_reasoning-image-test.jsonl: 100%|██████████| 734/734 [20:58<00:00,  1.71s/it]
-[2024-08-03 15:34:13] Rank 0 Finish
-cat work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/temp_InternVL2-2B_reasoning-image-test/* >  work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/InternVL2-2B_reasoning-image-test.jsonl
-cat work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/temp_InternVL2-2B_reasoning-image-test/* >  work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/InternVL2-2B_reasoning-image-test.jsonl
-cat work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/temp_InternVL2-2B_reasoning-image-test/* >  work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/InternVL2-2B_reasoning-image-test.jsonl
-cat work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/temp_InternVL2-2B_reasoning-image-test/* >  work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/InternVL2-2B_reasoning-image-test.jsonl
-python eval/mm_niah/calculate_scores.py --outputs-dir   work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test
-python eval/mm_niah/calculate_scores.py --outputs-dir   work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test
-python eval/mm_niah/calculate_scores.py --outputs-dir   work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test
-python eval/mm_niah/calculate_scores.py --outputs-dir   work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test
-[Warning] Since len(res)=1 is not equal to 6, the overall score will be ignored. Please ensure that you correctly organize the directory structure.
-
-results on test split of InternVL2-2B are save in work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/results/InternVL2-2B/scores_test.json
-[Warning] Since len(res)=1 is not equal to 6, the overall score will be ignored. Please ensure that you correctly organize the directory structure.
-
-results on test split of InternVL2-2B are save in work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/results/InternVL2-2B/scores_test.json
-[Warning] Since len(res)=1 is not equal to 6, the overall score will be ignored. Please ensure that you correctly organize the directory structure.
-
-results on test split of InternVL2-2B are save in work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/results/InternVL2-2B/scores_test.json
-[Warning] Since len(res)=1 is not equal to 6, the overall score will be ignored. Please ensure that you correctly organize the directory structure.
-
-results on test split of InternVL2-2B are save in work_dirs/share_internvl/InternVL2-2B/eval_mm_niah/reasoning-image-test/results/InternVL2-2B/scores_test.json