diff --git "a/stats/compression_rate/google-bert.bert-base-multilingual-uncased @ cc100.zh-Hans.diff.json" "b/stats/compression_rate/google-bert.bert-base-multilingual-uncased @ cc100.zh-Hans.diff.json" --- "a/stats/compression_rate/google-bert.bert-base-multilingual-uncased @ cc100.zh-Hans.diff.json" +++ "b/stats/compression_rate/google-bert.bert-base-multilingual-uncased @ cc100.zh-Hans.diff.json" @@ -1,1118 +1,1118 @@ -[ - { - "text": "卍招财带什么佛牌卍(www.suzastampin.com)卡尔・斯利姆于2012年加入塔塔汽车公司担任总经理一职,并负责公司在印度及国际市场上除捷豹和路虎以外的业务。这位斯坦福大学的毕业生,曾任通用汽车在中国合资公司的。近日,编辑专门联系到山西传奇北京现代汽车4S店得知,店内朗动车型有现车供应,现阶段购车可享受最高6000元优惠幅度,具体的车型和价格情况请见下表,同时感兴趣的朋友还可致电4008112233转3456详询:", - "decoded_text": "卍 招 财 带 什 么 佛 牌 卍 ( www. suzastampin. com ) 卡 尔 ・ 斯 利 姆 于 2012 年 加 入 塔 塔 汽 车 公 司 担 任 总 经 理 一 职 , 并 负 责 公 司 在 印 度 及 国 际 市 场 上 除 捷 豹 和 路 虎 以 外 的 业 务 。 这 位 斯 坦 福 大 学 的 毕 业 生 , 曾 任 通 用 汽 车 在 中 国 合 资 公 司 的 。 近 日 , 编 辑 专 门 联 系 到 山 西 传 奇 北 京 现 代 汽 车 4s 店 得 知 , 店 内 朗 动 车 型 有 现 车 供 应 , 现 阶 段 购 车 可 享 受 最 高 6000 元 优 惠 幅 度 , 具 体 的 车 型 和 价 格 情 况 请 见 下 表 , 同 时 感 兴 趣 的 朋 友 还 可 致 电 4008112233 转 3456 详 询 :", - "diff": [ - "insert text[1:1] --> decoded_text[1:2] '' --> ' '", - "insert text[2:2] --> decoded_text[3:4] '' --> ' '", - "insert text[3:3] --> decoded_text[5:6] '' --> ' '", - "insert text[4:4] --> decoded_text[7:8] '' --> ' '", - "insert text[5:5] --> decoded_text[9:10] '' --> ' '", - "insert text[6:6] --> decoded_text[11:12] '' --> ' '", - "insert text[7:7] --> decoded_text[13:14] '' --> ' '", - "insert text[8:8] --> decoded_text[15:16] '' --> ' '", - "insert text[9:9] --> decoded_text[17:18] '' --> ' '", - "insert text[10:10] --> decoded_text[19:20] '' --> ' '", - "insert text[14:14] --> decoded_text[24:25] '' --> ' '", - "insert text[26:26] --> decoded_text[37:38] '' --> ' '", - "insert text[29:29] --> decoded_text[41:42] '' --> ' '", - "insert text[30:30] --> decoded_text[43:44] '' --> ' '", - "insert text[31:31] --> decoded_text[45:46] '' --> ' '", - "insert text[32:32] --> decoded_text[47:48] '' --> ' '", - "insert text[33:33] --> decoded_text[49:50] '' --> ' '", - "insert text[34:34] --> decoded_text[51:52] '' --> ' '", - "insert text[35:35] --> decoded_text[53:54] '' --> ' '", - "insert text[36:36] --> decoded_text[55:56] '' --> ' '", - "insert text[37:37] --> decoded_text[57:58] '' --> ' '", - "insert text[41:41] --> decoded_text[62:63] '' --> ' '", - "insert text[42:42] --> decoded_text[64:65] '' --> ' '", - "insert text[43:43] --> decoded_text[66:67] '' --> ' '", - "insert text[44:44] --> decoded_text[68:69] '' --> ' '", - "insert text[45:45] --> decoded_text[70:71] '' --> ' '", - "insert text[46:46] --> decoded_text[72:73] '' --> ' '", - "replace text[47:48] --> decoded_text[74:77] '车' --> ' 车 '", - "insert text[49:49] --> decoded_text[78:79] '' --> ' '", - "insert text[50:50] --> decoded_text[80:81] '' --> ' '", - "insert text[51:51] --> decoded_text[82:83] '' --> ' '", - "insert text[52:52] --> decoded_text[84:85] '' --> ' '", - "insert text[53:53] --> decoded_text[86:87] '' --> ' '", - "insert text[54:54] --> decoded_text[88:89] '' --> ' '", - "insert text[55:55] --> decoded_text[90:91] '' --> ' '", - "insert text[56:56] --> decoded_text[92:93] '' --> ' '", - "replace text[57:58] --> decoded_text[94:97] ',' --> ' , '", - "insert text[59:59] --> decoded_text[98:99] '' --> ' '", - "insert text[60:60] --> decoded_text[100:101] '' --> ' '", - "insert text[61:61] --> decoded_text[102:103] '' --> ' '", - "insert text[62:62] --> decoded_text[104:105] '' --> ' '", - "insert text[63:63] --> decoded_text[106:107] '' --> ' '", - "insert text[64:64] --> decoded_text[108:109] '' --> ' '", - "insert text[65:65] --> decoded_text[110:111] '' --> ' '", - "insert text[66:66] --> decoded_text[112:113] '' --> ' '", - "insert text[67:67] --> decoded_text[114:115] '' --> ' '", - "insert text[68:68] --> decoded_text[116:117] '' --> ' '", - "insert text[69:69] --> decoded_text[118:119] '' --> ' '", - "insert text[70:70] --> decoded_text[120:121] '' --> ' '", - "insert text[71:71] --> decoded_text[122:123] '' --> ' '", - "insert text[72:72] --> decoded_text[124:125] '' --> ' '", - "insert text[73:73] --> decoded_text[126:127] '' --> ' '", - "insert text[74:74] --> decoded_text[128:129] '' --> ' '", - "insert text[75:75] --> decoded_text[130:131] '' --> ' '", - "insert text[76:76] --> decoded_text[132:133] '' --> ' '", - "insert text[77:77] --> decoded_text[134:135] '' --> ' '", - "insert text[78:78] --> decoded_text[136:137] '' --> ' '", - "insert text[79:79] --> decoded_text[138:139] '' --> ' '", - "replace text[80:81] --> decoded_text[140:143] '的' --> ' 的 '", - "insert text[82:82] --> decoded_text[144:145] '' --> ' '", - "insert text[83:83] --> decoded_text[146:147] '' --> ' '", - "insert text[84:84] --> decoded_text[148:149] '' --> ' '", - "insert text[85:85] --> decoded_text[150:151] '' --> ' '", - "insert text[86:86] --> decoded_text[152:153] '' --> ' '", - "insert text[87:87] --> decoded_text[154:155] '' --> ' '", - "insert text[88:88] --> decoded_text[156:157] '' --> ' '", - "insert text[89:89] --> decoded_text[158:159] '' --> ' '", - "insert text[90:90] --> decoded_text[160:161] '' --> ' '", - "replace text[91:92] --> decoded_text[162:165] '的' --> ' 的 '", - "insert text[93:93] --> decoded_text[166:167] '' --> ' '", - "insert text[94:94] --> decoded_text[168:169] '' --> ' '", - "replace text[95:96] --> decoded_text[170:173] ',' --> ' , '", - "insert text[97:97] --> decoded_text[174:175] '' --> ' '", - "insert text[98:98] --> decoded_text[176:177] '' --> ' '", - "insert text[99:99] --> decoded_text[178:179] '' --> ' '", - "insert text[100:100] --> decoded_text[180:181] '' --> ' '", - "replace text[101:102] --> decoded_text[182:185] '车' --> ' 车 '", - "insert text[103:103] --> decoded_text[186:187] '' --> ' '", - "insert text[104:104] --> decoded_text[188:189] '' --> ' '", - "insert text[105:105] --> decoded_text[190:191] '' --> ' '", - "insert text[106:106] --> decoded_text[192:193] '' --> ' '", - "insert text[107:107] --> decoded_text[194:195] '' --> ' '", - "insert text[108:108] --> decoded_text[196:197] '' --> ' '", - "replace text[109:110] --> decoded_text[198:201] '的' --> ' 的 '", - "insert text[111:111] --> decoded_text[202:203] '' --> ' '", - "insert text[112:112] --> decoded_text[204:205] '' --> ' '", - "replace text[113:114] --> decoded_text[206:209] ',' --> ' , '", - "insert text[115:115] --> decoded_text[210:211] '' --> ' '", - "insert text[116:116] --> decoded_text[212:213] '' --> ' '", - "insert text[117:117] --> decoded_text[214:215] '' --> ' '", - "insert text[118:118] --> decoded_text[216:217] '' --> ' '", - "insert text[119:119] --> decoded_text[218:219] '' --> ' '", - "insert text[120:120] --> decoded_text[220:221] '' --> ' '", - "insert text[121:121] --> decoded_text[222:223] '' --> ' '", - "insert text[122:122] --> decoded_text[224:225] '' --> ' '", - "insert text[123:123] --> decoded_text[226:227] '' --> ' '", - "insert text[124:124] --> decoded_text[228:229] '' --> ' '", - "insert text[125:125] --> decoded_text[230:231] '' --> ' '", - "insert text[126:126] --> decoded_text[232:233] '' --> ' '", - "insert text[127:127] --> decoded_text[234:235] '' --> ' '", - "insert text[128:128] --> decoded_text[236:237] '' --> ' '", - "insert text[129:129] --> decoded_text[238:239] '' --> ' '", - "replace text[130:131] --> decoded_text[240:243] '车' --> ' 车 '", - "replace text[132:133] --> decoded_text[244:246] 'S' --> 's '", - "insert text[134:134] --> decoded_text[247:248] '' --> ' '", - "insert text[135:135] --> decoded_text[249:250] '' --> ' '", - "replace text[136:137] --> decoded_text[251:254] ',' --> ' , '", - "insert text[138:138] --> decoded_text[255:256] '' --> ' '", - "insert text[139:139] --> decoded_text[257:258] '' --> ' '", - "insert text[140:140] --> decoded_text[259:260] '' --> ' '", - "replace text[141:142] --> decoded_text[261:264] '车' --> ' 车 '", - "insert text[143:143] --> decoded_text[265:266] '' --> ' '", - "insert text[144:144] --> decoded_text[267:268] '' --> ' '", - "replace text[145:146] --> decoded_text[269:272] '车' --> ' 车 '", - "insert text[147:147] --> decoded_text[273:274] '' --> ' '", - "replace text[148:149] --> decoded_text[275:278] ',' --> ' ��� '", - "insert text[150:150] --> decoded_text[279:280] '' --> ' '", - "insert text[151:151] --> decoded_text[281:282] '' --> ' '", - "insert text[152:152] --> decoded_text[283:284] '' --> ' '", - "replace text[153:154] --> decoded_text[285:288] '车' --> ' 车 '", - "insert text[155:155] --> decoded_text[289:290] '' --> ' '", - "insert text[156:156] --> decoded_text[291:292] '' --> ' '", - "insert text[157:157] --> decoded_text[293:294] '' --> ' '", - "insert text[158:158] --> decoded_text[295:296] '' --> ' '", - "insert text[159:159] --> decoded_text[297:298] '' --> ' '", - "insert text[163:163] --> decoded_text[302:303] '' --> ' '", - "insert text[164:164] --> decoded_text[304:305] '' --> ' '", - "insert text[165:165] --> decoded_text[306:307] '' --> ' '", - "insert text[166:166] --> decoded_text[308:309] '' --> ' '", - "insert text[167:167] --> decoded_text[310:311] '' --> ' '", - "replace text[168:169] --> decoded_text[312:315] ',' --> ' , '", - "insert text[170:170] --> decoded_text[316:317] '' --> ' '", - "replace text[171:173] --> decoded_text[318:323] '的车' --> ' 的 车 '", - "insert text[174:174] --> decoded_text[324:325] '' --> ' '", - "insert text[175:175] --> decoded_text[326:327] '' --> ' '", - "insert text[176:176] --> decoded_text[328:329] '' --> ' '", - "insert text[177:177] --> decoded_text[330:331] '' --> ' '", - "insert text[178:178] --> decoded_text[332:333] '' --> ' '", - "insert text[179:179] --> decoded_text[334:335] '' --> ' '", - "insert text[180:180] --> decoded_text[336:337] '' --> ' '", - "insert text[181:181] --> decoded_text[338:339] '' --> ' '", - "insert text[182:182] --> decoded_text[340:341] '' --> ' '", - "replace text[183:184] --> decoded_text[342:345] ',' --> ' , '", - "insert text[185:185] --> decoded_text[346:347] '' --> ' '", - "insert text[186:186] --> decoded_text[348:349] '' --> ' '", - "insert text[187:187] --> decoded_text[350:351] '' --> ' '", - "insert text[188:188] --> decoded_text[352:353] '' --> ' '", - "replace text[189:190] --> decoded_text[354:357] '的' --> ' 的 '", - "insert text[191:191] --> decoded_text[358:359] '' --> ' '", - "insert text[192:192] --> decoded_text[360:361] '' --> ' '", - "insert text[193:193] --> decoded_text[362:363] '' --> ' '", - "insert text[194:194] --> decoded_text[364:365] '' --> ' '", - "insert text[195:195] --> decoded_text[366:367] '' --> ' '", - "insert text[196:196] --> decoded_text[368:369] '' --> ' '", - "insert text[206:206] --> decoded_text[379:380] '' --> ' '", - "insert text[207:207] --> decoded_text[381:382] '' --> ' '", - "insert text[211:211] --> decoded_text[386:387] '' --> ' '", - "insert text[212:212] --> decoded_text[388:389] '' --> ' '", - "insert text[213:213] --> decoded_text[390:391] '' --> ' '" - ], - "n_oov_chars": 1, - "oov_ratio": 0.004672897196261682, - "oov_charset": "[\"S\"]" - }, - { - "text": "一个类似美国大片《幸福终点站》的案例令中国驻圣彼得堡领事官胡滨印象深刻。由于行前未能仔细核对签证有效期,一对赴俄罗斯旅游的中国夫妇因为签证过期差点被困在俄罗斯。在胡滨的协助下,这对夫妇经历了惊心动魄的3小时,终于在飞机起飞前5分钟,登上返程的航班。", - "decoded_text": "一 个 类 似 美 国 大 片 《 幸 福 终 点 站 》 的 案 例 令 中 国 驻 圣 彼 得 堡 领 事 官 胡 滨 印 象 深 刻 。 由 于 行 前 未 能 仔 细 核 对 签 证 有 效 期 , 一 对 赴 俄 罗 斯 旅 游 的 中 国 夫 妇 因 为 签 证 过 期 差 点 被 困 在 俄 罗 斯 。 在 胡 滨 的 协 助 下 , 这 对 夫 妇 经 历 了 惊 心 动 魄 的 3 小 时 , 终 于 在 飞 机 起 飞 前 5 分 钟 , 登 上 返 程 的 航 班 。", - "diff": [ - "insert text[1:1] --> decoded_text[1:2] '' --> ' '", - "insert text[2:2] --> decoded_text[3:4] '' --> ' '", - "insert text[3:3] --> decoded_text[5:6] '' --> ' '", - "insert text[4:4] --> decoded_text[7:8] '' --> ' '", - "insert text[5:5] --> decoded_text[9:10] '' --> ' '", - "insert text[6:6] --> decoded_text[11:12] '' --> ' '", - "insert text[7:7] --> decoded_text[13:14] '' --> ' '", - "insert text[8:8] --> decoded_text[15:16] '' --> ' '", - "insert text[9:9] --> decoded_text[17:18] '' --> ' '", - "insert text[10:10] --> decoded_text[19:20] '' --> ' '", - "insert text[11:11] --> decoded_text[21:22] '' --> ' '", - "insert text[12:12] --> decoded_text[23:24] '' --> ' '", - "insert text[13:13] --> decoded_text[25:26] '' --> ' '", - "insert text[14:14] --> decoded_text[27:28] '' --> ' '", - "replace text[15:16] --> decoded_text[29:32] '的' --> ' 的 '", - "insert text[17:17] --> decoded_text[33:34] '' --> ' '", - "insert text[18:18] --> decoded_text[35:36] '' --> ' '", - "insert text[19:19] --> decoded_text[37:38] '' --> ' '", - "insert text[20:20] --> decoded_text[39:40] '' --> ' '", - "insert text[21:21] --> decoded_text[41:42] '' --> ' '", - "insert text[22:22] --> decoded_text[43:44] '' --> ' '", - "insert text[23:23] --> decoded_text[45:46] '' --> ' '", - "insert text[24:24] --> decoded_text[47:48] '' --> ' '", - "insert text[25:25] --> decoded_text[49:50] '' --> ' '", - "insert text[26:26] --> decoded_text[51:52] '' --> ' '", - "insert text[27:27] --> decoded_text[53:54] '' --> ' '", - "insert text[28:28] --> decoded_text[55:56] '' --> ' '", - "insert text[29:29] --> decoded_text[57:58] '' --> ' '", - "insert text[30:30] --> decoded_text[59:60] '' --> ' '", - "insert text[31:31] --> decoded_text[61:62] '' --> ' '", - "insert text[32:32] --> decoded_text[63:64] '' --> ' '", - "insert text[33:33] --> decoded_text[65:66] '' --> ' '", - "insert text[34:34] --> decoded_text[67:68] '' --> ' '", - "insert text[35:35] --> decoded_text[69:70] '' --> ' '", - "insert text[36:36] --> decoded_text[71:72] '' --> ' '", - "insert text[37:37] --> decoded_text[73:74] '' --> ' '", - "insert text[38:38] --> decoded_text[75:76] '' --> ' '", - "insert text[39:39] --> decoded_text[77:78] '' --> ' '", - "insert text[40:40] --> decoded_text[79:80] '' --> ' '", - "insert text[41:41] --> decoded_text[81:82] '' --> ' '", - "insert text[42:42] --> decoded_text[83:84] '' --> ' '", - "insert text[43:43] --> decoded_text[85:86] '' --> ' '", - "insert text[44:44] --> decoded_text[87:88] '' --> ' '", - "insert text[45:45] --> decoded_text[89:90] '' --> ' '", - "insert text[46:46] --> decoded_text[91:92] '' --> ' '", - "insert text[47:47] --> decoded_text[93:94] '' --> ' '", - "insert text[48:48] --> decoded_text[95:96] '' --> ' '", - "insert text[49:49] --> decoded_text[97:98] '' --> ' '", - "insert text[50:50] --> decoded_text[99:100] '' --> ' '", - "replace text[51:52] --> decoded_text[101:104] ',' --> ' , '", - "insert text[53:53] --> decoded_text[105:106] '' --> ' '", - "insert text[54:54] --> decoded_text[107:108] '' --> ' '", - "insert text[55:55] --> decoded_text[109:110] '' --> ' '", - "insert text[56:56] --> decoded_text[111:112] '' --> ' '", - "insert text[57:57] --> decoded_text[113:114] '' --> ' '", - "insert text[58:58] --> decoded_text[115:116] '' --> ' '", - "insert text[59:59] --> decoded_text[117:118] '' --> ' '", - "replace text[60:61] --> decoded_text[119:122] '的' --> ' 的 '", - "insert text[62:62] --> decoded_text[123:124] '' --> ' '", - "insert text[63:63] --> decoded_text[125:126] '' --> ' '", - "insert text[64:64] --> decoded_text[127:128] '' --> ' '", - "insert text[65:65] --> decoded_text[129:130] '' --> ' '", - "insert text[66:66] --> decoded_text[131:132] '' --> ' '", - "insert text[67:67] --> decoded_text[133:134] '' --> ' '", - "insert text[68:68] --> decoded_text[135:136] '' --> ' '", - "insert text[69:69] --> decoded_text[137:138] '' --> ' '", - "insert text[70:70] --> decoded_text[139:140] '' --> ' '", - "insert text[71:71] --> decoded_text[141:142] '' --> ' '", - "insert text[72:72] --> decoded_text[143:144] '' --> ' '", - "insert text[73:73] --> decoded_text[145:146] '' --> ' '", - "insert text[74:74] --> decoded_text[147:148] '' --> ' '", - "insert text[75:75] --> decoded_text[149:150] '' --> ' '", - "insert text[76:76] --> decoded_text[151:152] '' --> ' '", - "insert text[77:77] --> decoded_text[153:154] '' --> ' '", - "insert text[78:78] --> decoded_text[155:156] '' --> ' '", - "insert text[79:79] --> decoded_text[157:158] '' --> ' '", - "insert text[80:80] --> decoded_text[159:160] '' --> ' '", - "insert text[81:81] --> decoded_text[161:162] '' --> ' '", - "insert text[82:82] --> decoded_text[163:164] '' --> ' '", - "replace text[83:84] --> decoded_text[165:168] '的' --> ' 的 '", - "insert text[85:85] --> decoded_text[169:170] '' --> ' '", - "insert text[86:86] --> decoded_text[171:172] '' --> ' '", - "replace text[87:88] --> decoded_text[173:176] ',' --> ' , '", - "insert text[89:89] --> decoded_text[177:178] '' --> ' '", - "insert text[90:90] --> decoded_text[179:180] '' --> ' '", - "insert text[91:91] --> decoded_text[181:182] '' --> ' '", - "insert text[92:92] --> decoded_text[183:184] '' --> ' '", - "insert text[93:93] --> decoded_text[185:186] '' --> ' '", - "insert text[94:94] --> decoded_text[187:188] '' --> ' '", - "insert text[95:95] --> decoded_text[189:190] '' --> ' '", - "insert text[96:96] --> decoded_text[191:192] '' --> ' '", - "insert text[97:97] --> decoded_text[193:194] '' --> ' '", - "insert text[98:98] --> decoded_text[195:196] '' --> ' '", - "replace text[99:100] --> decoded_text[197:200] '的' --> ' 的 '", - "insert text[101:101] --> decoded_text[201:202] '' --> ' '", - "insert text[102:102] --> decoded_text[203:204] '' --> ' '", - "replace text[103:104] --> decoded_text[205:208] ',' --> ' , '", - "insert text[105:105] --> decoded_text[209:210] '' --> ' '", - "insert text[106:106] --> decoded_text[211:212] '' --> ' '", - "insert text[107:107] --> decoded_text[213:214] '' --> ' '", - "insert text[108:108] --> decoded_text[215:216] '' --> ' '", - "insert text[109:109] --> decoded_text[217:218] '' --> ' '", - "insert text[110:110] --> decoded_text[219:220] '' --> ' '", - "insert text[111:111] --> decoded_text[221:222] '' --> ' '", - "insert text[112:112] --> decoded_text[223:224] '' --> ' '", - "insert text[113:113] --> decoded_text[225:226] '' --> ' '", - "insert text[114:114] --> decoded_text[227:228] '' --> ' '", - "replace text[115:116] --> decoded_text[229:232] ',' --> ' , '", - "insert text[117:117] --> decoded_text[233:234] '' --> ' '", - "insert text[118:118] --> decoded_text[235:236] '' --> ' '", - "insert text[119:119] --> decoded_text[237:238] '' --> ' '", - "replace text[120:121] --> decoded_text[239:242] '的' --> ' 的 '", - "insert text[122:122] --> decoded_text[243:244] '' --> ' '", - "insert text[123:123] --> decoded_text[245:246] '' --> ' '" - ], - "n_oov_chars": 0, - "oov_ratio": 0.0, - "oov_charset": "[]" - }, - { - "text": "招财带什么佛牌张德江在致辞中表示,中法建交开启了中法两个伟大国家友好关系的新纪元,树立了不同社会制度国家和平共处的新典范,对国际战略格局产生了重大而深远的影响。", - "decoded_text": "招 财 带 什 么 佛 牌 张 德 江 在 致 辞 中 表 示 , 中 法 建 交 开 启 了 中 法 两 个 伟 大 国 家 友 好 关 系 的 新 纪 元 , 树 立 了 不 同 社 会 制 度 国 家 和 平 共 处 的 新 典 范 , 对 国 际 战 略 格 局 产 生 了 重 大 而 深 远 的 影 响 。", - "diff": [ - "insert text[1:1] --> decoded_text[1:2] '' --> ' '", - "insert text[2:2] --> decoded_text[3:4] '' --> ' '", - "insert text[3:3] --> decoded_text[5:6] '' --> ' '", - "insert text[4:4] --> decoded_text[7:8] '' --> ' '", - "insert text[5:5] --> decoded_text[9:10] '' --> ' '", - "insert text[6:6] --> decoded_text[11:12] '' --> ' '", - "insert text[7:7] --> decoded_text[13:14] '' --> ' '", - "insert text[8:8] --> decoded_text[15:16] '' --> ' '", - "insert text[9:9] --> decoded_text[17:18] '' --> ' '", - "insert text[10:10] --> decoded_text[19:20] '' --> ' '", - "insert text[11:11] --> decoded_text[21:22] '' --> ' '", - "insert text[12:12] --> decoded_text[23:24] '' --> ' '", - "insert text[13:13] --> decoded_text[25:26] '' --> ' '", - "insert text[14:14] --> decoded_text[27:28] '' --> ' '", - "insert text[15:15] --> decoded_text[29:30] '' --> ' '", - "insert text[16:16] --> decoded_text[31:32] '' --> ' '", - "insert text[17:17] --> decoded_text[33:34] '' --> ' '", - "insert text[18:18] --> decoded_text[35:36] '' --> ' '", - "insert text[19:19] --> decoded_text[37:38] '' --> ' '", - "insert text[20:20] --> decoded_text[39:40] '' --> ' '", - "insert text[21:21] --> decoded_text[41:42] '' --> ' '", - "insert text[22:22] --> decoded_text[43:44] '' --> ' '", - "insert text[23:23] --> decoded_text[45:46] '' --> ' '", - "insert text[24:24] --> decoded_text[47:48] '' --> ' '", - "insert text[25:25] --> decoded_text[49:50] '' --> ' '", - "insert text[26:26] --> decoded_text[51:52] '' --> ' '", - "insert text[27:27] --> decoded_text[53:54] '' --> ' '", - "insert text[28:28] --> decoded_text[55:56] '' --> ' '", - "insert text[29:29] --> decoded_text[57:58] '' --> ' '", - "insert text[30:30] --> decoded_text[59:60] '' --> ' '", - "insert text[31:31] --> decoded_text[61:62] '' --> ' '", - "insert text[32:32] --> decoded_text[63:64] '' --> ' '", - "insert text[33:33] --> decoded_text[65:66] '' --> ' '", - "insert text[34:34] --> decoded_text[67:68] '' --> ' '", - "insert text[35:35] --> decoded_text[69:70] '' --> ' '", - "insert text[36:36] --> decoded_text[71:72] '' --> ' '", - "insert text[37:37] --> decoded_text[73:74] '' --> ' '", - "insert text[38:38] --> decoded_text[75:76] '' --> ' '", - "insert text[39:39] --> decoded_text[77:78] '' --> ' '", - "insert text[40:40] --> decoded_text[79:80] '' --> ' '", - "insert text[41:41] --> decoded_text[81:82] '' --> ' '", - "insert text[42:42] --> decoded_text[83:84] '' --> ' '", - "insert text[43:43] --> decoded_text[85:86] '' --> ' '", - "insert text[44:44] --> decoded_text[87:88] '' --> ' '", - "insert text[45:45] --> decoded_text[89:90] '' --> ' '", - "insert text[46:46] --> decoded_text[91:92] '' --> ' '", - "insert text[47:47] --> decoded_text[93:94] '' --> ' '", - "insert text[48:48] --> decoded_text[95:96] '' --> ' '", - "insert text[49:49] --> decoded_text[97:98] '' --> ' '", - "insert text[50:50] --> decoded_text[99:100] '' --> ' '", - "insert text[51:51] --> decoded_text[101:102] '' --> ' '", - "insert text[52:52] --> decoded_text[103:104] '' --> ' '", - "insert text[53:53] --> decoded_text[105:106] '' --> ' '", - "insert text[54:54] --> decoded_text[107:108] '' --> ' '", - "insert text[55:55] --> decoded_text[109:110] '' --> ' '", - "insert text[56:56] --> decoded_text[111:112] '' --> ' '", - "insert text[57:57] --> decoded_text[113:114] '' --> ' '", - "insert text[58:58] --> decoded_text[115:116] '' --> ' '", - "insert text[59:59] --> decoded_text[117:118] '' --> ' '", - "insert text[60:60] --> decoded_text[119:120] '' --> ' '", - "insert text[61:61] --> decoded_text[121:122] '' --> ' '", - "insert text[62:62] --> decoded_text[123:124] '' --> ' '", - "insert text[63:63] --> decoded_text[125:126] '' --> ' '", - "insert text[64:64] --> decoded_text[127:128] '' --> ' '", - "insert text[65:65] --> decoded_text[129:130] '' --> ' '", - "insert text[66:66] --> decoded_text[131:132] '' --> ' '", - "insert text[67:67] --> decoded_text[133:134] '' --> ' '", - "insert text[68:68] --> decoded_text[135:136] '' --> ' '", - "insert text[69:69] --> decoded_text[137:138] '' --> ' '", - "insert text[70:70] --> decoded_text[139:140] '' --> ' '", - "insert text[71:71] --> decoded_text[141:142] '' --> ' '", - "insert text[72:72] --> decoded_text[143:144] '' --> ' '", - "insert text[73:73] --> decoded_text[145:146] '' --> ' '", - "insert text[74:74] --> decoded_text[147:148] '' --> ' '", - "insert text[75:75] --> decoded_text[149:150] '' --> ' '", - "insert text[76:76] --> decoded_text[151:152] '' --> ' '", - "insert text[77:77] --> decoded_text[153:154] '' --> ' '", - "insert text[78:78] --> decoded_text[155:156] '' --> ' '", - "insert text[79:79] --> decoded_text[157:158] '' --> ' '" - ], - "n_oov_chars": 0, - "oov_ratio": 0.0, - "oov_charset": "[]" - }, - { - "text": "招财带什么佛牌科斯格罗夫一直供职于军队,曾被派往马来西亚、越南、英国、印度、美国工作。1999年,他成为联合国驻东帝汶部队司令,监督东帝汶向独立国家的过渡。", - "decoded_text": "招 财 带 什 么 佛 牌 科 斯 格 罗 夫 一 直 供 职 于 军 队 , 曾 被 派 往 马 来 西 亚 、 越 南 、 英 国 、 印 度 、 美 国 工 作 。 1999 年 , 他 成 为 联 合 国 驻 东 帝 汶 部 队 司 令 , 监 督 东 帝 汶 向 独 立 国 家 的 过 渡 。", - "diff": [ - "insert text[1:1] --> decoded_text[1:2] '' --> ' '", - "insert text[2:2] --> decoded_text[3:4] '' --> ' '", - "insert text[3:3] --> decoded_text[5:6] '' --> ' '", - "insert text[4:4] --> decoded_text[7:8] '' --> ' '", - "insert text[5:5] --> decoded_text[9:10] '' --> ' '", - "insert text[6:6] --> decoded_text[11:12] '' --> ' '", - "insert text[7:7] --> decoded_text[13:14] '' --> ' '", - "insert text[8:8] --> decoded_text[15:16] '' --> ' '", - "insert text[9:9] --> decoded_text[17:18] '' --> ' '", - "insert text[10:10] --> decoded_text[19:20] '' --> ' '", - "insert text[11:11] --> decoded_text[21:22] '' --> ' '", - "insert text[12:12] --> decoded_text[23:24] '' --> ' '", - "insert text[13:13] --> decoded_text[25:26] '' --> ' '", - "insert text[14:14] --> decoded_text[27:28] '' --> ' '", - "insert text[15:15] --> decoded_text[29:30] '' --> ' '", - "insert text[16:16] --> decoded_text[31:32] '' --> ' '", - "insert text[17:17] --> decoded_text[33:34] '' --> ' '", - "insert text[18:18] --> decoded_text[35:36] '' --> ' '", - "insert text[19:19] --> decoded_text[37:38] '' --> ' '", - "insert text[20:20] --> decoded_text[39:40] '' --> ' '", - "insert text[21:21] --> decoded_text[41:42] '' --> ' '", - "insert text[22:22] --> decoded_text[43:44] '' --> ' '", - "insert text[23:23] --> decoded_text[45:46] '' --> ' '", - "insert text[24:24] --> decoded_text[47:48] '' --> ' '", - "insert text[25:25] --> decoded_text[49:50] '' --> ' '", - "insert text[26:26] --> decoded_text[51:52] '' --> ' '", - "insert text[27:27] --> decoded_text[53:54] '' --> ' '", - "insert text[28:28] --> decoded_text[55:56] '' --> ' '", - "insert text[29:29] --> decoded_text[57:58] '' --> ' '", - "insert text[30:30] --> decoded_text[59:60] '' --> ' '", - "insert text[31:31] --> decoded_text[61:62] '' --> ' '", - "insert text[32:32] --> decoded_text[63:64] '' --> ' '", - "insert text[33:33] --> decoded_text[65:66] '' --> ' '", - "insert text[34:34] --> decoded_text[67:68] '' --> ' '", - "insert text[35:35] --> decoded_text[69:70] '' --> ' '", - "insert text[36:36] --> decoded_text[71:72] '' --> ' '", - "insert text[37:37] --> decoded_text[73:74] '' --> ' '", - "insert text[38:38] --> decoded_text[75:76] '' --> ' '", - "insert text[39:39] --> decoded_text[77:78] '' --> ' '", - "insert text[40:40] --> decoded_text[79:80] '' --> ' '", - "insert text[41:41] --> decoded_text[81:82] '' --> ' '", - "insert text[42:42] --> decoded_text[83:84] '' --> ' '", - "insert text[43:43] --> decoded_text[85:86] '' --> ' '", - "insert text[47:47] --> decoded_text[90:91] '' --> ' '", - "insert text[48:48] --> decoded_text[92:93] '' --> ' '", - "insert text[49:49] --> decoded_text[94:95] '' --> ' '", - "insert text[50:50] --> decoded_text[96:97] '' --> ' '", - "insert text[51:51] --> decoded_text[98:99] '' --> ' '", - "insert text[52:52] --> decoded_text[100:101] '' --> ' '", - "insert text[53:53] --> decoded_text[102:103] '' --> ' '", - "insert text[54:54] --> decoded_text[104:105] '' --> ' '", - "insert text[55:55] --> decoded_text[106:107] '' --> ' '", - "insert text[56:56] --> decoded_text[108:109] '' --> ' '", - "insert text[57:57] --> decoded_text[110:111] '' --> ' '", - "insert text[58:58] --> decoded_text[112:113] '' --> ' '", - "insert text[59:59] --> decoded_text[114:115] '' --> ' '", - "insert text[60:60] --> decoded_text[116:117] '' --> ' '", - "insert text[61:61] --> decoded_text[118:119] '' --> ' '", - "insert text[62:62] --> decoded_text[120:121] '' --> ' '", - "insert text[63:63] --> decoded_text[122:123] '' --> ' '", - "insert text[64:64] --> decoded_text[124:125] '' --> ' '", - "insert text[65:65] --> decoded_text[126:127] '' --> ' '", - "insert text[66:66] --> decoded_text[128:129] '' --> ' '", - "insert text[67:67] --> decoded_text[130:131] '' --> ' '", - "insert text[68:68] --> decoded_text[132:133] '' --> ' '", - "insert text[69:69] --> decoded_text[134:135] '' --> ' '", - "insert text[70:70] --> decoded_text[136:137] '' --> ' '", - "insert text[71:71] --> decoded_text[138:139] '' --> ' '", - "insert text[72:72] --> decoded_text[140:141] '' --> ' '", - "insert text[73:73] --> decoded_text[142:143] '' --> ' '", - "insert text[74:74] --> decoded_text[144:145] '' --> ' '", - "insert text[75:75] --> decoded_text[146:147] '' --> ' '", - "insert text[76:76] --> decoded_text[148:149] '' --> ' '", - "insert text[77:77] --> decoded_text[150:151] '' --> ' '" - ], - "n_oov_chars": 0, - "oov_ratio": 0.0, - "oov_charset": "[]" - }, - { - "text": "1月28日电据香港《明报》消息,在庆祝披头士进军美国音乐市场50周年的纪念日子,格莱美向两名仅存成员:保罗麦卡尼及灵高史达(RingoStarr)颁发终身成就奖,显得别具意义。为了隆重其事,大会请来金像影后茱莉亚••罗伯茨(JuliaRoberts)负责介绍二人出场,保罗在拍档的鼓声和应下,先献唱新歌《QueenieEye》,然后轮到后者演绎旧作《Photograph》,带领歌迷重温昔日的美好情怀。", - "decoded_text": "1 月 28 日 电 据 香 港 《 明 报 》 消 息 , 在 庆 祝 披 头 士 进 军 美 国 音 乐 市 场 50 周 年 的 纪 念 日 子 , 格 莱 美 向 两 名 仅 存 成 员 : 保 罗 麦 卡 尼 及 灵 高 史 达 ( ringostarr ) 颁 发 终 身 成 就 奖 , 显 得 别 具 意 义 。 为 了 隆 重 其 事 , 大 会 请 来 金 像 影 后 茱 莉 亚 • • 罗 伯 茨 ( juliaroberts ) 负 责 介 绍 二 人 出 场 , 保 罗 在 拍 档 的 鼓 声 和 应 下 , 先 献 唱 新 歌 《 queenieeye 》 , 然 后 轮 到 后 者 演 绎 旧 作 《 photograph 》 , 带 领 歌 迷 重 温 昔 日 的 美 好 情 怀 。", - "diff": [ - "insert text[1:1] --> decoded_text[1:2] '' --> ' '", - "insert text[2:2] --> decoded_text[3:4] '' --> ' '", - "insert text[4:4] --> decoded_text[6:7] '' --> ' '", - "insert text[5:5] --> decoded_text[8:9] '' --> ' '", - "insert text[6:6] --> decoded_text[10:11] '' --> ' '", - "insert text[7:7] --> decoded_text[12:13] '' --> ' '", - "insert text[8:8] --> decoded_text[14:15] '' --> ' '", - "insert text[9:9] --> decoded_text[16:17] '' --> ' '", - "insert text[10:10] --> decoded_text[18:19] '' --> ' '", - "insert text[11:11] --> decoded_text[20:21] '' --> ' '", - "insert text[12:12] --> decoded_text[22:23] '' --> ' '", - "insert text[13:13] --> decoded_text[24:25] '' --> ' '", - "insert text[14:14] --> decoded_text[26:27] '' --> ' '", - "replace text[15:16] --> decoded_text[28:31] ',' --> ' , '", - "insert text[17:17] --> decoded_text[32:33] '' --> ' '", - "insert text[18:18] --> decoded_text[34:35] '' --> ' '", - "insert text[19:19] --> decoded_text[36:37] '' --> ' '", - "insert text[20:20] --> decoded_text[38:39] '' --> ' '", - "insert text[21:21] --> decoded_text[40:41] '' --> ' '", - "insert text[22:22] --> decoded_text[42:43] '' --> ' '", - "insert text[23:23] --> decoded_text[44:45] '' --> ' '", - "insert text[24:24] --> decoded_text[46:47] '' --> ' '", - "insert text[25:25] --> decoded_text[48:49] '' --> ' '", - "insert text[26:26] --> decoded_text[50:51] '' --> ' '", - "insert text[27:27] --> decoded_text[52:53] '' --> ' '", - "insert text[28:28] --> decoded_text[54:55] '' --> ' '", - "insert text[29:29] --> decoded_text[56:57] '' --> ' '", - "insert text[30:30] --> decoded_text[58:59] '' --> ' '", - "insert text[32:32] --> decoded_text[61:62] '' --> ' '", - "insert text[33:33] --> decoded_text[63:64] '' --> ' '", - "insert text[34:34] --> decoded_text[65:66] '' --> ' '", - "insert text[35:35] --> decoded_text[67:68] '' --> ' '", - "insert text[36:36] --> decoded_text[69:70] '' --> ' '", - "insert text[37:37] --> decoded_text[71:72] '' --> ' '", - "insert text[38:38] --> decoded_text[73:74] '' --> ' '", - "replace text[39:40] --> decoded_text[75:78] ',' --> ' , '", - "insert text[41:41] --> decoded_text[79:80] '' --> ' '", - "insert text[42:42] --> decoded_text[81:82] '' --> ' '", - "insert text[43:43] --> decoded_text[83:84] '' --> ' '", - "insert text[44:44] --> decoded_text[85:86] '' --> ' '", - "insert text[45:45] --> decoded_text[87:88] '' --> ' '", - "insert text[46:46] --> decoded_text[89:90] '' --> ' '", - "insert text[47:47] --> decoded_text[91:92] '' --> ' '", - "insert text[48:48] --> decoded_text[93:94] '' --> ' '", - "insert text[49:49] --> decoded_text[95:96] '' --> ' '", - "insert text[50:50] --> decoded_text[97:98] '' --> ' '", - "insert text[51:51] --> decoded_text[99:100] '' --> ' '", - "insert text[52:52] --> decoded_text[101:102] '' --> ' '", - "insert text[53:53] --> decoded_text[103:104] '' --> ' '", - "insert text[54:54] --> decoded_text[105:106] '' --> ' '", - "insert text[55:55] --> decoded_text[107:108] '' --> ' '", - "insert text[56:56] --> decoded_text[109:110] '' --> ' '", - "insert text[57:57] --> decoded_text[111:112] '' --> ' '", - "insert text[58:58] --> decoded_text[113:114] '' --> ' '", - "insert text[59:59] --> decoded_text[115:116] '' --> ' '", - "insert text[60:60] --> decoded_text[117:118] '' --> ' '", - "insert text[61:61] --> decoded_text[119:120] '' --> ' '", - "replace text[62:63] --> decoded_text[121:123] 'R' --> ' r'", - "replace text[67:68] --> decoded_text[127:128] 'S' --> 's'", - "insert text[72:72] --> decoded_text[132:133] '' --> ' '", - "insert text[73:73] --> decoded_text[134:135] '' --> ' '", - "insert text[74:74] --> decoded_text[136:137] '' --> ' '", - "insert text[75:75] --> decoded_text[138:139] '' --> ' '", - "insert text[76:76] --> decoded_text[140:141] '' --> ' '", - "insert text[77:77] --> decoded_text[142:143] '' --> ' '", - "insert text[78:78] --> decoded_text[144:145] '' --> ' '", - "insert text[79:79] --> decoded_text[146:147] '' --> ' '", - "replace text[80:81] --> decoded_text[148:151] ',' --> ' , '", - "insert text[82:82] --> decoded_text[152:153] '' --> ' '", - "insert text[83:83] --> decoded_text[154:155] '' --> ' '", - "insert text[84:84] --> decoded_text[156:157] '' --> ' '", - "insert text[85:85] --> decoded_text[158:159] '' --> ' '", - "insert text[86:86] --> decoded_text[160:161] '' --> ' '", - "insert text[87:87] --> decoded_text[162:163] '' --> ' '", - "insert text[88:88] --> decoded_text[164:165] '' --> ' '", - "insert text[89:89] --> decoded_text[166:167] '' --> ' '", - "insert text[90:90] --> decoded_text[168:169] '' --> ' '", - "insert text[91:91] --> decoded_text[170:171] '' --> ' '", - "insert text[92:92] --> decoded_text[172:173] '' --> ' '", - "insert text[93:93] --> decoded_text[174:175] '' --> ' '", - "replace text[94:95] --> decoded_text[176:179] ',' --> ' , '", - "insert text[96:96] --> decoded_text[180:181] '' --> ' '", - "insert text[97:97] --> decoded_text[182:183] '' --> ' '", - "insert text[98:98] --> decoded_text[184:185] '' --> ' '", - "insert text[99:99] --> decoded_text[186:187] '' --> ' '", - "insert text[100:100] --> decoded_text[188:189] '' --> ' '", - "insert text[101:101] --> decoded_text[190:191] '' --> ' '", - "insert text[102:102] --> decoded_text[192:193] '' --> ' '", - "insert text[103:103] --> decoded_text[194:195] '' --> ' '", - "insert text[104:104] --> decoded_text[196:197] '' --> ' '", - "insert text[105:105] --> decoded_text[198:199] '' --> ' '", - "insert text[106:106] --> decoded_text[200:201] '' --> ' '", - "insert text[107:107] --> decoded_text[202:203] '' --> ' '", - "insert text[108:108] --> decoded_text[204:205] '' --> ' '", - "insert text[109:109] --> decoded_text[206:207] '' --> ' '", - "insert text[110:110] --> decoded_text[208:209] '' --> ' '", - "insert text[111:111] --> decoded_text[210:211] '' --> ' '", - "replace text[112:113] --> decoded_text[212:214] 'J' --> ' j'", - "replace text[117:118] --> decoded_text[218:219] 'R' --> 'r'", - "insert text[124:124] --> decoded_text[225:226] '' --> ' '", - "insert text[125:125] --> decoded_text[227:228] '' --> ' '", - "insert text[126:126] --> decoded_text[229:230] '' --> ' '", - "insert text[127:127] --> decoded_text[231:232] '' --> ' '", - "insert text[128:128] --> decoded_text[233:234] '' --> ' '", - "insert text[129:129] --> decoded_text[235:236] '' --> ' '", - "insert text[130:130] --> decoded_text[237:238] '' --> ' '", - "insert text[131:131] --> decoded_text[239:240] '' --> ' '", - "insert text[132:132] --> decoded_text[241:242] '' --> ' '", - "replace text[133:134] --> decoded_text[243:246] ',' --> ' , '", - "insert text[135:135] --> decoded_text[247:248] '' --> ' '", - "insert text[136:136] --> decoded_text[249:250] '' --> ' '", - "insert text[137:137] --> decoded_text[251:252] '' --> ' '", - "insert text[138:138] --> decoded_text[253:254] '' --> ' '", - "insert text[139:139] --> decoded_text[255:256] '' --> ' '", - "insert text[140:140] --> decoded_text[257:258] '' --> ' '", - "insert text[141:141] --> decoded_text[259:260] '' --> ' '", - "insert text[142:142] --> decoded_text[261:262] '' --> ' '", - "insert text[143:143] --> decoded_text[263:264] '' --> ' '", - "insert text[144:144] --> decoded_text[265:266] '' --> ' '", - "replace text[145:146] --> decoded_text[267:270] ',' --> ' , '", - "insert text[147:147] --> decoded_text[271:272] '' --> ' '", - "insert text[148:148] --> decoded_text[273:274] '' --> ' '", - "insert text[149:149] --> decoded_text[275:276] '' --> ' '", - "insert text[150:150] --> decoded_text[277:278] '' --> ' '", - "insert text[151:151] --> decoded_text[279:280] '' --> ' '", - "replace text[152:153] --> decoded_text[281:283] 'Q' --> ' q'", - "replace text[159:160] --> decoded_text[289:290] 'E' --> 'e'", - "insert text[162:162] --> decoded_text[292:293] '' --> ' '", - "replace text[163:164] --> decoded_text[294:297] ',' --> ' , '", - "insert text[165:165] --> decoded_text[298:299] '' --> ' '", - "insert text[166:166] --> decoded_text[300:301] '' --> ' '", - "insert text[167:167] --> decoded_text[302:303] '' --> ' '", - "insert text[168:168] --> decoded_text[304:305] '' --> ' '", - "insert text[169:169] --> decoded_text[306:307] '' --> ' '", - "insert text[170:170] --> decoded_text[308:309] '' --> ' '", - "insert text[171:171] --> decoded_text[310:311] '' --> ' '", - "insert text[172:172] --> decoded_text[312:313] '' --> ' '", - "insert text[173:173] --> decoded_text[314:315] '' --> ' '", - "insert text[174:174] --> decoded_text[316:317] '' --> ' '", - "replace text[175:176] --> decoded_text[318:320] 'P' --> ' p'", - "insert text[185:185] --> decoded_text[329:330] '' --> ' '", - "replace text[186:187] --> decoded_text[331:334] ',' --> ' , '", - "insert text[188:188] --> decoded_text[335:336] '' --> ' '", - "insert text[189:189] --> decoded_text[337:338] '' --> ' '", - "insert text[190:190] --> decoded_text[339:340] '' --> ' '", - "insert text[191:191] --> decoded_text[341:342] '' --> ' '", - "insert text[192:192] --> decoded_text[343:344] '' --> ' '", - "insert text[193:193] --> decoded_text[345:346] '' --> ' '", - "insert text[194:194] --> decoded_text[347:348] '' --> ' '", - "insert text[195:195] --> decoded_text[349:350] '' --> ' '", - "insert text[196:196] --> decoded_text[351:352] '' --> ' '", - "insert text[197:197] --> decoded_text[353:354] '' --> ' '", - "insert text[198:198] --> decoded_text[355:356] '' --> ' '", - "insert text[199:199] --> decoded_text[357:358] '' --> ' '", - "insert text[200:200] --> decoded_text[359:360] '' --> ' '" - ], - "n_oov_chars": 7, - "oov_ratio": 0.03482587064676617, - "oov_charset": "[\"R\", \"S\", \"J\", \"Q\", \"E\", \"P\"]" - }, - { - "text": "佛牌绳哪里有卖到达目的地后,记者全程的总车费是14元,但司机到账21元,因此,司机给记者7元,除去之前支付的1元,记者净赚6元,还免费乘了本应支付14元的车。", - "decoded_text": "佛 牌 绳 哪 里 有 卖 到 达 目 的 地 后 , 记 者 全 程 的 总 车 费 是 14 元 , 但 司 机 到 账 21 元 , 因 此 , 司 机 给 记 者 7 元 , 除 去 之 前 支 付 的 1 元 , 记 者 净 赚 6 元 , 还 免 费 乘 了 本 应 支 付 14 元 的 车 。", - "diff": [ - "insert text[1:1] --> decoded_text[1:2] '' --> ' '", - "insert text[2:2] --> decoded_text[3:4] '' --> ' '", - "insert text[3:3] --> decoded_text[5:6] '' --> ' '", - "insert text[4:4] --> decoded_text[7:8] '' --> ' '", - "insert text[5:5] --> decoded_text[9:10] '' --> ' '", - "insert text[6:6] --> decoded_text[11:12] '' --> ' '", - "insert text[7:7] --> decoded_text[13:14] '' --> ' '", - "insert text[8:8] --> decoded_text[15:16] '' --> ' '", - "insert text[9:9] --> decoded_text[17:18] '' --> ' '", - "insert text[10:10] --> decoded_text[19:20] '' --> ' '", - "insert text[11:11] --> decoded_text[21:22] '' --> ' '", - "insert text[12:12] --> decoded_text[23:24] '' --> ' '", - "insert text[13:13] --> decoded_text[25:26] '' --> ' '", - "insert text[14:14] --> decoded_text[27:28] '' --> ' '", - "insert text[15:15] --> decoded_text[29:30] '' --> ' '", - "insert text[16:16] --> decoded_text[31:32] '' --> ' '", - "insert text[17:17] --> decoded_text[33:34] '' --> ' '", - "insert text[18:18] --> decoded_text[35:36] '' --> ' '", - "insert text[19:19] --> decoded_text[37:38] '' --> ' '", - "insert text[20:20] --> decoded_text[39:40] '' --> ' '", - "insert text[21:21] --> decoded_text[41:42] '' --> ' '", - "insert text[22:22] --> decoded_text[43:44] '' --> ' '", - "insert text[23:23] --> decoded_text[45:46] '' --> ' '", - "insert text[25:25] --> decoded_text[48:49] '' --> ' '", - "insert text[26:26] --> decoded_text[50:51] '' --> ' '", - "insert text[27:27] --> decoded_text[52:53] '' --> ' '", - "insert text[28:28] --> decoded_text[54:55] '' --> ' '", - "insert text[29:29] --> decoded_text[56:57] '' --> ' '", - "insert text[30:30] --> decoded_text[58:59] '' --> ' '", - "insert text[31:31] --> decoded_text[60:61] '' --> ' '", - "insert text[32:32] --> decoded_text[62:63] '' --> ' '", - "insert text[34:34] --> decoded_text[65:66] '' --> ' '", - "insert text[35:35] --> decoded_text[67:68] '' --> ' '", - "insert text[36:36] --> decoded_text[69:70] '' --> ' '", - "insert text[37:37] --> decoded_text[71:72] '' --> ' '", - "insert text[38:38] --> decoded_text[73:74] '' --> ' '", - "insert text[39:39] --> decoded_text[75:76] '' --> ' '", - "insert text[40:40] --> decoded_text[77:78] '' --> ' '", - "insert text[41:41] --> decoded_text[79:80] '' --> ' '", - "insert text[42:42] --> decoded_text[81:82] '' --> ' '", - "insert text[43:43] --> decoded_text[83:84] '' --> ' '", - "insert text[44:44] --> decoded_text[85:86] '' --> ' '", - "insert text[45:45] --> decoded_text[87:88] '' --> ' '", - "insert text[46:46] --> decoded_text[89:90] '' --> ' '", - "insert text[47:47] --> decoded_text[91:92] '' --> ' '", - "insert text[48:48] --> decoded_text[93:94] '' --> ' '", - "insert text[49:49] --> decoded_text[95:96] '' --> ' '", - "insert text[50:50] --> decoded_text[97:98] '' --> ' '", - "insert text[51:51] --> decoded_text[99:100] '' --> ' '", - "insert text[52:52] --> decoded_text[101:102] '' --> ' '", - "insert text[53:53] --> decoded_text[103:104] '' --> ' '", - "insert text[54:54] --> decoded_text[105:106] '' --> ' '", - "insert text[55:55] --> decoded_text[107:108] '' --> ' '", - "insert text[56:56] --> decoded_text[109:110] '' --> ' '", - "insert text[57:57] --> decoded_text[111:112] '' --> ' '", - "insert text[58:58] --> decoded_text[113:114] '' --> ' '", - "insert text[59:59] --> decoded_text[115:116] '' --> ' '", - "insert text[60:60] --> decoded_text[117:118] '' --> ' '", - "insert text[61:61] --> decoded_text[119:120] '' --> ' '", - "insert text[62:62] --> decoded_text[121:122] '' --> ' '", - "insert text[63:63] --> decoded_text[123:124] '' --> ' '", - "insert text[64:64] --> decoded_text[125:126] '' --> ' '", - "insert text[65:65] --> decoded_text[127:128] '' --> ' '", - "insert text[66:66] --> decoded_text[129:130] '' --> ' '", - "insert text[67:67] --> decoded_text[131:132] '' --> ' '", - "insert text[68:68] --> decoded_text[133:134] '' --> ' '", - "insert text[69:69] --> decoded_text[135:136] '' --> ' '", - "insert text[70:70] --> decoded_text[137:138] '' --> ' '", - "insert text[71:71] --> decoded_text[139:140] '' --> ' '", - "insert text[72:72] --> decoded_text[141:142] '' --> ' '", - "insert text[73:73] --> decoded_text[143:144] '' --> ' '", - "insert text[75:75] --> decoded_text[146:147] '' --> ' '", - "insert text[76:76] --> decoded_text[148:149] '' --> ' '", - "insert text[77:77] --> decoded_text[150:151] '' --> ' '", - "insert text[78:78] --> decoded_text[152:153] '' --> ' '" - ], - "n_oov_chars": 0, - "oov_ratio": 0.0, - "oov_charset": "[]" - }, - { - "text": "卡尔・斯利姆于2012年加入塔塔汽车公司担任总经理一职,并负责公司在印度及国际市场上除捷豹和路虎以外的业务。这位斯坦福大学的毕业生,曾任通用汽车在中国合资公司的副总裁,上汽通用五菱公司的副总裁以及通用汽车印度公司的总裁。(方赵春)", - "decoded_text": "卡 尔 ・ 斯 利 姆 于 2012 年 加 入 塔 塔 汽 车 公 司 担 任 总 经 理 一 职 , 并 负 责 公 司 在 印 度 及 国 际 市 场 上 除 捷 豹 和 路 虎 以 外 的 业 务 。 这 位 斯 坦 福 大 学 的 毕 业 生 , 曾 任 通 用 汽 车 在 中 国 合 资 公 司 的 副 总 裁 , 上 汽 通 用 五 菱 公 司 的 副 总 裁 以 及 通 用 汽 车 印 度 公 司 的 总 裁 。 ( 方 赵 春 )", - "diff": [ - "insert text[1:1] --> decoded_text[1:2] '' --> ' '", - "insert text[2:2] --> decoded_text[3:4] '' --> ' '", - "insert text[3:3] --> decoded_text[5:6] '' --> ' '", - "insert text[4:4] --> decoded_text[7:8] '' --> ' '", - "insert text[5:5] --> decoded_text[9:10] '' --> ' '", - "insert text[6:6] --> decoded_text[11:12] '' --> ' '", - "insert text[7:7] --> decoded_text[13:14] '' --> ' '", - "insert text[11:11] --> decoded_text[18:19] '' --> ' '", - "insert text[12:12] --> decoded_text[20:21] '' --> ' '", - "insert text[13:13] --> decoded_text[22:23] '' --> ' '", - "insert text[14:14] --> decoded_text[24:25] '' --> ' '", - "insert text[15:15] --> decoded_text[26:27] '' --> ' '", - "replace text[16:17] --> decoded_text[28:31] '汽' --> ' 汽 '", - "replace text[18:20] --> decoded_text[32:37] '公司' --> ' 公 司 '", - "insert text[21:21] --> decoded_text[38:39] '' --> ' '", - "replace text[22:23] --> decoded_text[40:43] '总' --> ' 总 '", - "insert text[24:24] --> decoded_text[44:45] '' --> ' '", - "insert text[25:25] --> decoded_text[46:47] '' --> ' '", - "insert text[26:26] --> decoded_text[48:49] '' --> ' '", - "insert text[27:27] --> decoded_text[50:51] '' --> ' '", - "insert text[28:28] --> decoded_text[52:53] '' --> ' '", - "insert text[29:29] --> decoded_text[54:55] '' --> ' '", - "insert text[30:30] --> decoded_text[56:57] '' --> ' '", - "replace text[31:33] --> decoded_text[58:63] '公司' --> ' 公 司 '", - "insert text[34:34] --> decoded_text[64:65] '' --> ' '", - "insert text[35:35] --> decoded_text[66:67] '' --> ' '", - "insert text[36:36] --> decoded_text[68:69] '' --> ' '", - "insert text[37:37] --> decoded_text[70:71] '' --> ' '", - "insert text[38:38] --> decoded_text[72:73] '' --> ' '", - "insert text[39:39] --> decoded_text[74:75] '' --> ' '", - "insert text[40:40] --> decoded_text[76:77] '' --> ' '", - "insert text[41:41] --> decoded_text[78:79] '' --> ' '", - "insert text[42:42] --> decoded_text[80:81] '' --> ' '", - "insert text[43:43] --> decoded_text[82:83] '' --> ' '", - "insert text[44:44] --> decoded_text[84:85] '' --> ' '", - "insert text[45:45] --> decoded_text[86:87] '' --> ' '", - "insert text[46:46] --> decoded_text[88:89] '' --> ' '", - "insert text[47:47] --> decoded_text[90:91] '' --> ' '", - "insert text[48:48] --> decoded_text[92:93] '' --> ' '", - "insert text[49:49] --> decoded_text[94:95] '' --> ' '", - "replace text[50:51] --> decoded_text[96:99] '的' --> ' 的 '", - "insert text[52:52] --> decoded_text[100:101] '' --> ' '", - "insert text[53:53] --> decoded_text[102:103] '' --> ' '", - "insert text[54:54] --> decoded_text[104:105] '' --> ' '", - "insert text[55:55] --> decoded_text[106:107] '' --> ' '", - "insert text[56:56] --> decoded_text[108:109] '' --> ' '", - "insert text[57:57] --> decoded_text[110:111] '' --> ' '", - "insert text[58:58] --> decoded_text[112:113] '' --> ' '", - "insert text[59:59] --> decoded_text[114:115] '' --> ' '", - "insert text[60:60] --> decoded_text[116:117] '' --> ' '", - "replace text[61:62] --> decoded_text[118:121] '的' --> ' 的 '", - "insert text[63:63] --> decoded_text[122:123] '' --> ' '", - "insert text[64:64] --> decoded_text[124:125] '' --> ' '", - "insert text[65:65] --> decoded_text[126:127] '' --> ' '", - "insert text[66:66] --> decoded_text[128:129] '' --> ' '", - "insert text[67:67] --> decoded_text[130:131] '' --> ' '", - "insert text[68:68] --> decoded_text[132:133] '' --> ' '", - "insert text[69:69] --> decoded_text[134:135] '' --> ' '", - "replace text[70:71] --> decoded_text[136:139] '汽' --> ' 汽 '", - "insert text[72:72] --> decoded_text[140:141] '' --> ' '", - "insert text[73:73] --> decoded_text[142:143] '' --> ' '", - "insert text[74:74] --> decoded_text[144:145] '' --> ' '", - "insert text[75:75] --> decoded_text[146:147] '' --> ' '", - "insert text[76:76] --> decoded_text[148:149] '' --> ' '", - "replace text[77:80] --> decoded_text[150:157] '公司的' --> ' 公 司 的 '", - "replace text[81:82] --> decoded_text[158:161] '总' --> ' 总 '", - "insert text[83:83] --> decoded_text[162:163] '' --> ' '", - "insert text[84:84] --> decoded_text[164:165] '' --> ' '", - "replace text[85:86] --> decoded_text[166:169] '汽' --> ' 汽 '", - "insert text[87:87] --> decoded_text[170:171] '' --> ' '", - "insert text[88:88] --> decoded_text[172:173] '' --> ' '", - "insert text[89:89] --> decoded_text[174:175] '' --> ' '", - "replace text[90:93] --> decoded_text[176:183] '公司的' --> ' 公 司 的 '", - "replace text[94:95] --> decoded_text[184:187] '总' --> ' 总 '", - "insert text[96:96] --> decoded_text[188:189] '' --> ' '", - "insert text[97:97] --> decoded_text[190:191] '' --> ' '", - "insert text[98:98] --> decoded_text[192:193] '' --> ' '", - "insert text[99:99] --> decoded_text[194:195] '' --> ' '", - "replace text[100:101] --> decoded_text[196:199] '汽' --> ' 汽 '", - "insert text[102:102] --> decoded_text[200:201] '' --> ' '", - "insert text[103:103] --> decoded_text[202:203] '' --> ' '", - "replace text[104:108] --> decoded_text[204:213] '公司的总' --> ' 公 司 的 总 '", - "insert text[109:109] --> decoded_text[214:215] '' --> ' '", - "insert text[110:110] --> decoded_text[216:217] '' --> ' '", - "insert text[111:111] --> decoded_text[218:219] '' --> ' '", - "insert text[112:112] --> decoded_text[220:221] '' --> ' '", - "insert text[113:113] --> decoded_text[222:223] '' --> ' '", - "insert text[114:114] --> decoded_text[224:225] '' --> ' '" - ], - "n_oov_chars": 0, - "oov_ratio": 0.0, - "oov_charset": "[]" - }, - { - "text": "大腕导演不可能每部作品都是你喜欢的东西,如果他一时控制不住情绪,就让他骂吧。他也是人,不是神,人就有自己的脾气。他这次执导春晚,对我也开骂:“老毕,我跟你说了这么长时间,让你走2号位,你非要走1号位,你想跟我较死劲是不是?”这也是骂人。但因为你非常了解他,他也不一定有恶意。", - "decoded_text": "大 腕 导 演 不 可 能 每 部 作 品 都 是 你 喜 欢 的 东 西 , 如 果 他 一 时 控 制 不 住 情 绪 , 就 让 他 骂 吧 。 他 也 是 人 , 不 是 神 , 人 就 有 自 己 的 脾 气 。 他 这 次 执 导 春 晚 , 对 我 也 开 骂 : [UNK] 老 毕 , 我 跟 你 说 了 这 么 长 时 间 , 让 你 走 2 号 位 , 你 非 要 走 1 号 位 , 你 想 跟 我 较 死 劲 是 不 是 ? [UNK] 这 也 是 骂 人 。 但 因 为 你 非 常 了 解 他 , 他 也 不 一 定 有 恶 意 。", - "diff": [ - "insert text[1:1] --> decoded_text[1:2] '' --> ' '", - "insert text[2:2] --> decoded_text[3:4] '' --> ' '", - "insert text[3:3] --> decoded_text[5:6] '' --> ' '", - "replace text[4:5] --> decoded_text[7:10] '不' --> ' 不 '", - "insert text[6:6] --> decoded_text[11:12] '' --> ' '", - "insert text[7:7] --> decoded_text[13:14] '' --> ' '", - "insert text[8:8] --> decoded_text[15:16] '' --> ' '", - "insert text[9:9] --> decoded_text[17:18] '' --> ' '", - "insert text[10:10] --> decoded_text[19:20] '' --> ' '", - "insert text[11:11] --> decoded_text[21:22] '' --> ' '", - "replace text[12:14] --> decoded_text[23:28] '是你' --> ' 是 你 '", - "insert text[15:15] --> decoded_text[29:30] '' --> ' '", - "insert text[16:16] --> decoded_text[31:32] '' --> ' '", - "insert text[17:17] --> decoded_text[33:34] '' --> ' '", - "insert text[18:18] --> decoded_text[35:36] '' --> ' '", - "replace text[19:20] --> decoded_text[37:40] ',' --> ' , '", - "insert text[21:21] --> decoded_text[41:42] '' --> ' '", - "replace text[22:23] --> decoded_text[43:46] '他' --> ' 他 '", - "insert text[24:24] --> decoded_text[47:48] '' --> ' '", - "insert text[25:25] --> decoded_text[49:50] '' --> ' '", - "insert text[26:26] --> decoded_text[51:52] '' --> ' '", - "replace text[27:28] --> decoded_text[53:56] '不' --> ' 不 '", - "insert text[29:29] --> decoded_text[57:58] '' --> ' '", - "insert text[30:30] --> decoded_text[59:60] '' --> ' '", - "replace text[31:32] --> decoded_text[61:64] ',' --> ' , '", - "insert text[33:33] --> decoded_text[65:66] '' --> ' '", - "replace text[34:35] --> decoded_text[67:70] '他' --> ' 他 '", - "insert text[36:36] --> decoded_text[71:72] '' --> ' '", - "replace text[37:41] --> decoded_text[73:82] '。他也是' --> ' 。 他 也 是 '", - "replace text[42:45] --> decoded_text[83:90] ',不是' --> ' , 不 是 '", - "replace text[46:47] --> decoded_text[91:94] ',' --> ' , '", - "insert text[48:48] --> decoded_text[95:96] '' --> ' '", - "insert text[49:49] --> decoded_text[97:98] '' --> ' '", - "insert text[50:50] --> decoded_text[99:100] '' --> ' '", - "insert text[51:51] --> decoded_text[101:102] '' --> ' '", - "insert text[52:52] --> decoded_text[103:104] '' --> ' '", - "insert text[53:53] --> decoded_text[105:106] '' --> ' '", - "insert text[54:54] --> decoded_text[107:108] '' --> ' '", - "replace text[55:57] --> decoded_text[109:114] '。他' --> ' 。 他 '", - "insert text[58:58] --> decoded_text[115:116] '' --> ' '", - "insert text[59:59] --> decoded_text[117:118] '' --> ' '", - "insert text[60:60] --> decoded_text[119:120] '' --> ' '", - "insert text[61:61] --> decoded_text[121:122] '' --> ' '", - "insert text[62:62] --> decoded_text[123:124] '' --> ' '", - "replace text[63:64] --> decoded_text[125:128] ',' --> ' , '", - "insert text[65:65] --> decoded_text[129:130] '' --> ' '", - "replace text[66:67] --> decoded_text[131:134] '也' --> ' 也 '", - "insert text[68:68] --> decoded_text[135:136] '' --> ' '", - "insert text[69:69] --> decoded_text[137:138] '' --> ' '", - "replace text[70:71] --> decoded_text[139:146] '“' --> ' [UNK] '", - "insert text[72:72] --> decoded_text[147:148] '' --> ' '", - "replace text[73:74] --> decoded_text[149:152] ',' --> ' , '", - "insert text[75:75] --> decoded_text[153:154] '' --> ' '", - "replace text[76:77] --> decoded_text[155:158] '你' --> ' 你 '", - "insert text[78:78] --> decoded_text[159:160] '' --> ' '", - "insert text[79:79] --> decoded_text[161:162] '' --> ' '", - "insert text[80:80] --> decoded_text[163:164] '' --> ' '", - "insert text[81:81] --> decoded_text[165:166] '' --> ' '", - "insert text[82:82] --> decoded_text[167:168] '' --> ' '", - "insert text[83:83] --> decoded_text[169:170] '' --> ' '", - "replace text[84:85] --> decoded_text[171:174] ',' --> ' , '", - "replace text[86:87] --> decoded_text[175:178] '你' --> ' 你 '", - "insert text[88:88] --> decoded_text[179:180] '' --> ' '", - "insert text[89:89] --> decoded_text[181:182] '' --> ' '", - "insert text[90:90] --> decoded_text[183:184] '' --> ' '", - "replace text[91:93] --> decoded_text[185:190] ',你' --> ' , 你 '", - "insert text[94:94] --> decoded_text[191:192] '' --> ' '", - "insert text[95:95] --> decoded_text[193:194] '' --> ' '", - "insert text[96:96] --> decoded_text[195:196] '' --> ' '", - "insert text[97:97] --> decoded_text[197:198] '' --> ' '", - "insert text[98:98] --> decoded_text[199:200] '' --> ' '", - "replace text[99:101] --> decoded_text[201:206] ',你' --> ' , 你 '", - "insert text[102:102] --> decoded_text[207:208] '' --> ' '", - "insert text[103:103] --> decoded_text[209:210] '' --> ' '", - "insert text[104:104] --> decoded_text[211:212] '' --> ' '", - "insert text[105:105] --> decoded_text[213:214] '' --> ' '", - "insert text[106:106] --> decoded_text[215:216] '' --> ' '", - "replace text[107:110] --> decoded_text[217:224] '是不是' --> ' 是 不 是 '", - "replace text[111:112] --> decoded_text[225:232] '”' --> ' [UNK] '", - "replace text[113:115] --> decoded_text[233:238] '也是' --> ' 也 是 '", - "insert text[116:116] --> decoded_text[239:240] '' --> ' '", - "replace text[117:118] --> decoded_text[241:244] '。' --> ' 。 '", - "insert text[119:119] --> decoded_text[245:246] '' --> ' '", - "insert text[120:120] --> decoded_text[247:248] '' --> ' '", - "replace text[121:122] --> decoded_text[249:252] '你' --> ' 你 '", - "insert text[123:123] --> decoded_text[253:254] '' --> ' '", - "insert text[124:124] --> decoded_text[255:256] '' --> ' '", - "insert text[125:125] --> decoded_text[257:258] '' --> ' '", - "replace text[126:131] --> decoded_text[259:270] '他,他也不' --> ' 他 , 他 也 不 '", - "insert text[132:132] --> decoded_text[271:272] '' --> ' '", - "insert text[133:133] --> decoded_text[273:274] '' --> ' '", - "insert text[134:134] --> decoded_text[275:276] '' --> ' '", - "insert text[135:135] --> decoded_text[277:278] '' --> ' '", - "replace text[136:137] --> decoded_text[279:281] '。' --> ' 。'" - ], - "n_oov_chars": 2, - "oov_ratio": 0.014598540145985401, - "oov_charset": "[\"“\", \"”\"]" - }, - { - "text": "招财带什么佛牌不过挣得多,娜姐也花得多。有媒体报道,教练卡洛斯的年薪高达360万元人民币,李娜每年的花费是600多万元。用一个形象的比喻,娜姐每天一睁眼,将近2万元就出去了。", - "decoded_text": "招 财 带 什 么 佛 牌 不 过 挣 得 多 , 娜 姐 也 花 得 多 。 有 媒 体 报 道 , 教 练 卡 洛 斯 的 年 薪 高 达 360 万 元 人 民 币 , 李 娜 每 年 的 花 费 是 600 多 万 元 。 用 一 个 形 象 的 比 喻 , 娜 姐 每 天 一 睁 眼 , 将 近 2 万 元 就 出 去 了 。", - "diff": [ - "insert text[1:1] --> decoded_text[1:2] '' --> ' '", - "insert text[2:2] --> decoded_text[3:4] '' --> ' '", - "insert text[3:3] --> decoded_text[5:6] '' --> ' '", - "insert text[4:4] --> decoded_text[7:8] '' --> ' '", - "insert text[5:5] --> decoded_text[9:10] '' --> ' '", - "insert text[6:6] --> decoded_text[11:12] '' --> ' '", - "insert text[7:7] --> decoded_text[13:14] '' --> ' '", - "insert text[8:8] --> decoded_text[15:16] '' --> ' '", - "insert text[9:9] --> decoded_text[17:18] '' --> ' '", - "insert text[10:10] --> decoded_text[19:20] '' --> ' '", - "insert text[11:11] --> decoded_text[21:22] '' --> ' '", - "insert text[12:12] --> decoded_text[23:24] '' --> ' '", - "insert text[13:13] --> decoded_text[25:26] '' --> ' '", - "insert text[14:14] --> decoded_text[27:28] '' --> ' '", - "insert text[15:15] --> decoded_text[29:30] '' --> ' '", - "insert text[16:16] --> decoded_text[31:32] '' --> ' '", - "insert text[17:17] --> decoded_text[33:34] '' --> ' '", - "insert text[18:18] --> decoded_text[35:36] '' --> ' '", - "insert text[19:19] --> decoded_text[37:38] '' --> ' '", - "insert text[20:20] --> decoded_text[39:40] '' --> ' '", - "insert text[21:21] --> decoded_text[41:42] '' --> ' '", - "insert text[22:22] --> decoded_text[43:44] '' --> ' '", - "insert text[23:23] --> decoded_text[45:46] '' --> ' '", - "insert text[24:24] --> decoded_text[47:48] '' --> ' '", - "insert text[25:25] --> decoded_text[49:50] '' --> ' '", - "insert text[26:26] --> decoded_text[51:52] '' --> ' '", - "insert text[27:27] --> decoded_text[53:54] '' --> ' '", - "insert text[28:28] --> decoded_text[55:56] '' --> ' '", - "insert text[29:29] --> decoded_text[57:58] '' --> ' '", - "insert text[30:30] --> decoded_text[59:60] '' --> ' '", - "insert text[31:31] --> decoded_text[61:62] '' --> ' '", - "insert text[32:32] --> decoded_text[63:64] '' --> ' '", - "insert text[33:33] --> decoded_text[65:66] '' --> ' '", - "insert text[34:34] --> decoded_text[67:68] '' --> ' '", - "insert text[35:35] --> decoded_text[69:70] '' --> ' '", - "insert text[36:36] --> decoded_text[71:72] '' --> ' '", - "insert text[39:39] --> decoded_text[75:76] '' --> ' '", - "insert text[40:40] --> decoded_text[77:78] '' --> ' '", - "insert text[41:41] --> decoded_text[79:80] '' --> ' '", - "insert text[42:42] --> decoded_text[81:82] '' --> ' '", - "insert text[43:43] --> decoded_text[83:84] '' --> ' '", - "insert text[44:44] --> decoded_text[85:86] '' --> ' '", - "insert text[45:45] --> decoded_text[87:88] '' --> ' '", - "insert text[46:46] --> decoded_text[89:90] '' --> ' '", - "insert text[47:47] --> decoded_text[91:92] '' --> ' '", - "insert text[48:48] --> decoded_text[93:94] '' --> ' '", - "insert text[49:49] --> decoded_text[95:96] '' --> ' '", - "insert text[50:50] --> decoded_text[97:98] '' --> ' '", - "insert text[51:51] --> decoded_text[99:100] '' --> ' '", - "insert text[52:52] --> decoded_text[101:102] '' --> ' '", - "insert text[53:53] --> decoded_text[103:104] '' --> ' '", - "insert text[56:56] --> decoded_text[107:108] '' --> ' '", - "insert text[57:57] --> decoded_text[109:110] '' --> ' '", - "insert text[58:58] --> decoded_text[111:112] '' --> ' '", - "insert text[59:59] --> decoded_text[113:114] '' --> ' '", - "insert text[60:60] --> decoded_text[115:116] '' --> ' '", - "insert text[61:61] --> decoded_text[117:118] '' --> ' '", - "insert text[62:62] --> decoded_text[119:120] '' --> ' '", - "insert text[63:63] --> decoded_text[121:122] '' --> ' '", - "insert text[64:64] --> decoded_text[123:124] '' --> ' '", - "insert text[65:65] --> decoded_text[125:126] '' --> ' '", - "insert text[66:66] --> decoded_text[127:128] '' --> ' '", - "insert text[67:67] --> decoded_text[129:130] '' --> ' '", - "insert text[68:68] --> decoded_text[131:132] '' --> ' '", - "insert text[69:69] --> decoded_text[133:134] '' --> ' '", - "insert text[70:70] --> decoded_text[135:136] '' --> ' '", - "insert text[71:71] --> decoded_text[137:138] '' --> ' '", - "insert text[72:72] --> decoded_text[139:140] '' --> ' '", - "insert text[73:73] --> decoded_text[141:142] '' --> ' '", - "insert text[74:74] --> decoded_text[143:144] '' --> ' '", - "insert text[75:75] --> decoded_text[145:146] '' --> ' '", - "insert text[76:76] --> decoded_text[147:148] '' --> ' '", - "insert text[77:77] --> decoded_text[149:150] '' --> ' '", - "insert text[78:78] --> decoded_text[151:152] '' --> ' '", - "insert text[79:79] --> decoded_text[153:154] '' --> ' '", - "insert text[80:80] --> decoded_text[155:156] '' --> ' '", - "insert text[81:81] --> decoded_text[157:158] '' --> ' '", - "insert text[82:82] --> decoded_text[159:160] '' --> ' '", - "insert text[83:83] --> decoded_text[161:162] '' --> ' '", - "insert text[84:84] --> decoded_text[163:164] '' --> ' '", - "insert text[85:85] --> decoded_text[165:166] '' --> ' '", - "insert text[86:86] --> decoded_text[167:168] '' --> ' '" - ], - "n_oov_chars": 0, - "oov_ratio": 0.0, - "oov_charset": "[]" - }, - { - "text": "“金庸的小说《连城诀》里有一个反派人物‘血刀老祖’,一般的坏人做坏事都是心虚的,但是这个人物却做得心安理得,理直气壮,我遇到的这个的哥就是这样。”王先生向记者描述经过时第一句话便这样说。原来,昨日王先生在搭出租车时,遇到的的哥不仅“拾金而昧”,还“昧”得理直气壮。", - "decoded_text": "[UNK] 金 庸 的 小 说 《 连 城 诀 》 里 有 一 个 反 派 人 物 [UNK] 血 刀 老 祖 [UNK] , 一 般 的 坏 人 做 坏 事 都 是 心 虚 的 , 但 是 这 个 人 物 却 做 得 心 安 理 得 , 理 直 气 壮 , 我 遇 到 的 这 个 的 哥 就 是 这 样 。 [UNK] 王 先 生 向 记 者 描 述 经 过 时 第 一 句 话 便 这 样 说 。 原 来 , 昨 日 王 先 生 在 搭 出 租 车 时 , 遇 到 的 的 哥 不 仅 [UNK] 拾 金 而 昧 [UNK] , 还 [UNK] 昧 [UNK] 得 理 直 气 壮 。", - "diff": [ - "replace text[0:1] --> decoded_text[0:6] '“' --> '[UNK] '", - "insert text[2:2] --> decoded_text[7:8] '' --> ' '", - "replace text[3:4] --> decoded_text[9:12] '的' --> ' 的 '", - "insert text[5:5] --> decoded_text[13:14] '' --> ' '", - "insert text[6:6] --> decoded_text[15:16] '' --> ' '", - "insert text[7:7] --> decoded_text[17:18] '' --> ' '", - "insert text[8:8] --> decoded_text[19:20] '' --> ' '", - "insert text[9:9] --> decoded_text[21:22] '' --> ' '", - "insert text[10:10] --> decoded_text[23:24] '' --> ' '", - "insert text[11:11] --> decoded_text[25:26] '' --> ' '", - "insert text[12:12] --> decoded_text[27:28] '' --> ' '", - "insert text[13:13] --> decoded_text[29:30] '' --> ' '", - "insert text[14:14] --> decoded_text[31:32] '' --> ' '", - "insert text[15:15] --> decoded_text[33:34] '' --> ' '", - "insert text[16:16] --> decoded_text[35:36] '' --> ' '", - "insert text[17:17] --> decoded_text[37:38] '' --> ' '", - "insert text[18:18] --> decoded_text[39:40] '' --> ' '", - "replace text[19:20] --> decoded_text[41:48] '‘' --> ' [UNK] '", - "insert text[21:21] --> decoded_text[49:50] '' --> ' '", - "insert text[22:22] --> decoded_text[51:52] '' --> ' '", - "insert text[23:23] --> decoded_text[53:54] '' --> ' '", - "replace text[24:26] --> decoded_text[55:64] '’,' --> ' [UNK] , '", - "insert text[27:27] --> decoded_text[65:66] '' --> ' '", - "replace text[28:29] --> decoded_text[67:70] '的' --> ' 的 '", - "insert text[30:30] --> decoded_text[71:72] '' --> ' '", - "insert text[31:31] --> decoded_text[73:74] '' --> ' '", - "insert text[32:32] --> decoded_text[75:76] '' --> ' '", - "insert text[33:33] --> decoded_text[77:78] '' --> ' '", - "insert text[34:34] --> decoded_text[79:80] '' --> ' '", - "insert text[35:35] --> decoded_text[81:82] '' --> ' '", - "insert text[36:36] --> decoded_text[83:84] '' --> ' '", - "insert text[37:37] --> decoded_text[85:86] '' --> ' '", - "replace text[38:40] --> decoded_text[87:92] '的,' --> ' 的 , '", - "insert text[41:41] --> decoded_text[93:94] '' --> ' '", - "replace text[42:43] --> decoded_text[95:98] '这' --> ' 这 '", - "insert text[44:44] --> decoded_text[99:100] '' --> ' '", - "insert text[45:45] --> decoded_text[101:102] '' --> ' '", - "insert text[46:46] --> decoded_text[103:104] '' --> ' '", - "insert text[47:47] --> decoded_text[105:106] '' --> ' '", - "insert text[48:48] --> decoded_text[107:108] '' --> ' '", - "insert text[49:49] --> decoded_text[109:110] '' --> ' '", - "insert text[50:50] --> decoded_text[111:112] '' --> ' '", - "insert text[51:51] --> decoded_text[113:114] '' --> ' '", - "insert text[52:52] --> decoded_text[115:116] '' --> ' '", - "replace text[53:54] --> decoded_text[117:120] ',' --> ' , '", - "insert text[55:55] --> decoded_text[121:122] '' --> ' '", - "insert text[56:56] --> decoded_text[123:124] '' --> ' '", - "insert text[57:57] --> decoded_text[125:126] '' --> ' '", - "replace text[58:59] --> decoded_text[127:130] ',' --> ' , '", - "insert text[60:60] --> decoded_text[131:132] '' --> ' '", - "insert text[61:61] --> decoded_text[133:134] '' --> ' '", - "replace text[62:64] --> decoded_text[135:140] '的这' --> ' 的 这 '", - "replace text[65:66] --> decoded_text[141:144] '的' --> ' 的 '", - "insert text[67:67] --> decoded_text[145:146] '' --> ' '", - "insert text[68:68] --> decoded_text[147:148] '' --> ' '", - "replace text[69:70] --> decoded_text[149:152] '这' --> ' 这 '", - "insert text[71:71] --> decoded_text[153:154] '' --> ' '", - "replace text[72:73] --> decoded_text[155:162] '”' --> ' [UNK] '", - "insert text[74:74] --> decoded_text[163:164] '' --> ' '", - "insert text[75:75] --> decoded_text[165:166] '' --> ' '", - "insert text[76:76] --> decoded_text[167:168] '' --> ' '", - "insert text[77:77] --> decoded_text[169:170] '' --> ' '", - "insert text[78:78] --> decoded_text[171:172] '' --> ' '", - "insert text[79:79] --> decoded_text[173:174] '' --> ' '", - "insert text[80:80] --> decoded_text[175:176] '' --> ' '", - "insert text[81:81] --> decoded_text[177:178] '' --> ' '", - "insert text[82:82] --> decoded_text[179:180] '' --> ' '", - "insert text[83:83] --> decoded_text[181:182] '' --> ' '", - "insert text[84:84] --> decoded_text[183:184] '' --> ' '", - "insert text[85:85] --> decoded_text[185:186] '' --> ' '", - "insert text[86:86] --> decoded_text[187:188] '' --> ' '", - "insert text[87:87] --> decoded_text[189:190] '' --> ' '", - "insert text[88:88] --> decoded_text[191:192] '' --> ' '", - "replace text[89:90] --> decoded_text[193:196] '这' --> ' 这 '", - "insert text[91:91] --> decoded_text[197:198] '' --> ' '", - "insert text[92:92] --> decoded_text[199:200] '' --> ' '", - "insert text[93:93] --> decoded_text[201:202] '' --> ' '", - "insert text[94:94] --> decoded_text[203:204] '' --> ' '", - "replace text[95:96] --> decoded_text[205:208] ',' --> ' , '", - "insert text[97:97] --> decoded_text[209:210] '' --> ' '", - "insert text[98:98] --> decoded_text[211:212] '' --> ' '", - "insert text[99:99] --> decoded_text[213:214] '' --> ' '", - "insert text[100:100] --> decoded_text[215:216] '' --> ' '", - "insert text[101:101] --> decoded_text[217:218] '' --> ' '", - "insert text[102:102] --> decoded_text[219:220] '' --> ' '", - "insert text[103:103] --> decoded_text[221:222] '' --> ' '", - "insert text[104:104] --> decoded_text[223:224] '' --> ' '", - "insert text[105:105] --> decoded_text[225:226] '' --> ' '", - "insert text[106:106] --> decoded_text[227:228] '' --> ' '", - "replace text[107:108] --> decoded_text[229:232] ',' --> ' , '", - "insert text[109:109] --> decoded_text[233:234] '' --> ' '", - "replace text[110:112] --> decoded_text[235:240] '的的' --> ' 的 的 '", - "insert text[113:113] --> decoded_text[241:242] '' --> ' '", - "insert text[114:114] --> decoded_text[243:244] '' --> ' '", - "replace text[115:116] --> decoded_text[245:252] '“' --> ' [UNK] '", - "insert text[117:117] --> decoded_text[253:254] '' --> ' '", - "insert text[118:118] --> decoded_text[255:256] '' --> ' '", - "insert text[119:119] --> decoded_text[257:258] '' --> ' '", - "replace text[120:122] --> decoded_text[259:268] '”,' --> ' [UNK] , '", - "replace text[123:124] --> decoded_text[269:276] '“' --> ' [UNK] '", - "replace text[125:126] --> decoded_text[277:284] '”' --> ' [UNK] '", - "insert text[127:127] --> decoded_text[285:286] '' --> ' '", - "insert text[128:128] --> decoded_text[287:288] '' --> ' '", - "insert text[129:129] --> decoded_text[289:290] '' --> ' '", - "insert text[130:130] --> decoded_text[291:292] '' --> ' '", - "insert text[131:131] --> decoded_text[293:294] '' --> ' '" - ], - "n_oov_chars": 8, - "oov_ratio": 0.06060606060606061, - "oov_charset": "[\"“\", \"‘\", \"’\", \"”\"]" - } +[ + { + "text": "卍招财带什么佛牌卍(www.suzastampin.com)卡尔・斯利姆于2012年加入塔塔汽车公司担任总经理一职,并负责公司在印度及国际市场上除捷豹和路虎以外的业务。这位斯坦福大学的毕业生,曾任通用汽车在中国合资公司的。近日,编辑专门联系到山西传奇北京现代汽车4S店得知,店内朗动车型有现车供应,现阶段购车可享受最高6000元优惠幅度,具体的车型和价格情况请见下表,同时感兴趣的朋友还可致电4008112233转3456详询:", + "decoded_text": "卍 招 财 带 什 么 佛 牌 卍 ( www. suzastampin. com ) 卡 尔 ・ 斯 利 姆 于 2012 年 加 入 塔 塔 汽 车 公 司 担 任 总 经 理 一 职 , 并 负 责 公 司 在 印 度 及 国 际 市 场 上 除 捷 豹 和 路 虎 以 外 的 业 务 。 这 位 斯 坦 福 大 学 的 毕 业 生 , 曾 任 通 用 汽 车 在 中 国 合 资 公 司 的 。 近 日 , 编 辑 专 门 联 系 到 山 西 传 奇 北 京 现 代 汽 车 4s 店 得 知 , 店 内 朗 动 车 型 有 现 车 供 应 , 现 阶 段 购 车 可 享 受 最 高 6000 元 优 惠 幅 度 , 具 体 的 车 型 和 价 格 情 况 请 见 下 表 , 同 时 感 兴 趣 的 朋 友 还 可 致 电 4008112233 转 3456 详 询 :", + "diff": [ + "insert text[1:1] --> decoded_text[1:2] '' --> ' '", + "insert text[2:2] --> decoded_text[3:4] '' --> ' '", + "insert text[3:3] --> decoded_text[5:6] '' --> ' '", + "insert text[4:4] --> decoded_text[7:8] '' --> ' '", + "insert text[5:5] --> decoded_text[9:10] '' --> ' '", + "insert text[6:6] --> decoded_text[11:12] '' --> ' '", + "insert text[7:7] --> decoded_text[13:14] '' --> ' '", + "insert text[8:8] --> decoded_text[15:16] '' --> ' '", + "insert text[9:9] --> decoded_text[17:18] '' --> ' '", + "insert text[10:10] --> decoded_text[19:20] '' --> ' '", + "insert text[14:14] --> decoded_text[24:25] '' --> ' '", + "insert text[26:26] --> decoded_text[37:38] '' --> ' '", + "insert text[29:29] --> decoded_text[41:42] '' --> ' '", + "insert text[30:30] --> decoded_text[43:44] '' --> ' '", + "insert text[31:31] --> decoded_text[45:46] '' --> ' '", + "insert text[32:32] --> decoded_text[47:48] '' --> ' '", + "insert text[33:33] --> decoded_text[49:50] '' --> ' '", + "insert text[34:34] --> decoded_text[51:52] '' --> ' '", + "insert text[35:35] --> decoded_text[53:54] '' --> ' '", + "insert text[36:36] --> decoded_text[55:56] '' --> ' '", + "insert text[37:37] --> decoded_text[57:58] '' --> ' '", + "insert text[41:41] --> decoded_text[62:63] '' --> ' '", + "insert text[42:42] --> decoded_text[64:65] '' --> ' '", + "insert text[43:43] --> decoded_text[66:67] '' --> ' '", + "insert text[44:44] --> decoded_text[68:69] '' --> ' '", + "insert text[45:45] --> decoded_text[70:71] '' --> ' '", + "insert text[46:46] --> decoded_text[72:73] '' --> ' '", + "replace text[47:48] --> decoded_text[74:77] '车' --> ' 车 '", + "insert text[49:49] --> decoded_text[78:79] '' --> ' '", + "insert text[50:50] --> decoded_text[80:81] '' --> ' '", + "insert text[51:51] --> decoded_text[82:83] '' --> ' '", + "insert text[52:52] --> decoded_text[84:85] '' --> ' '", + "insert text[53:53] --> decoded_text[86:87] '' --> ' '", + "insert text[54:54] --> decoded_text[88:89] '' --> ' '", + "insert text[55:55] --> decoded_text[90:91] '' --> ' '", + "insert text[56:56] --> decoded_text[92:93] '' --> ' '", + "replace text[57:58] --> decoded_text[94:97] ',' --> ' , '", + "insert text[59:59] --> decoded_text[98:99] '' --> ' '", + "insert text[60:60] --> decoded_text[100:101] '' --> ' '", + "insert text[61:61] --> decoded_text[102:103] '' --> ' '", + "insert text[62:62] --> decoded_text[104:105] '' --> ' '", + "insert text[63:63] --> decoded_text[106:107] '' --> ' '", + "insert text[64:64] --> decoded_text[108:109] '' --> ' '", + "insert text[65:65] --> decoded_text[110:111] '' --> ' '", + "insert text[66:66] --> decoded_text[112:113] '' --> ' '", + "insert text[67:67] --> decoded_text[114:115] '' --> ' '", + "insert text[68:68] --> decoded_text[116:117] '' --> ' '", + "insert text[69:69] --> decoded_text[118:119] '' --> ' '", + "insert text[70:70] --> decoded_text[120:121] '' --> ' '", + "insert text[71:71] --> decoded_text[122:123] '' --> ' '", + "insert text[72:72] --> decoded_text[124:125] '' --> ' '", + "insert text[73:73] --> decoded_text[126:127] '' --> ' '", + "insert text[74:74] --> decoded_text[128:129] '' --> ' '", + "insert text[75:75] --> decoded_text[130:131] '' --> ' '", + "insert text[76:76] --> decoded_text[132:133] '' --> ' '", + "insert text[77:77] --> decoded_text[134:135] '' --> ' '", + "insert text[78:78] --> decoded_text[136:137] '' --> ' '", + "insert text[79:79] --> decoded_text[138:139] '' --> ' '", + "replace text[80:81] --> decoded_text[140:143] '的' --> ' 的 '", + "insert text[82:82] --> decoded_text[144:145] '' --> ' '", + "insert text[83:83] --> decoded_text[146:147] '' --> ' '", + "insert text[84:84] --> decoded_text[148:149] '' --> ' '", + "insert text[85:85] --> decoded_text[150:151] '' --> ' '", + "insert text[86:86] --> decoded_text[152:153] '' --> ' '", + "insert text[87:87] --> decoded_text[154:155] '' --> ' '", + "insert text[88:88] --> decoded_text[156:157] '' --> ' '", + "insert text[89:89] --> decoded_text[158:159] '' --> ' '", + "insert text[90:90] --> decoded_text[160:161] '' --> ' '", + "replace text[91:92] --> decoded_text[162:165] '的' --> ' 的 '", + "insert text[93:93] --> decoded_text[166:167] '' --> ' '", + "insert text[94:94] --> decoded_text[168:169] '' --> ' '", + "replace text[95:96] --> decoded_text[170:173] ',' --> ' , '", + "insert text[97:97] --> decoded_text[174:175] '' --> ' '", + "insert text[98:98] --> decoded_text[176:177] '' --> ' '", + "insert text[99:99] --> decoded_text[178:179] '' --> ' '", + "insert text[100:100] --> decoded_text[180:181] '' --> ' '", + "replace text[101:102] --> decoded_text[182:185] '车' --> ' 车 '", + "insert text[103:103] --> decoded_text[186:187] '' --> ' '", + "insert text[104:104] --> decoded_text[188:189] '' --> ' '", + "insert text[105:105] --> decoded_text[190:191] '' --> ' '", + "insert text[106:106] --> decoded_text[192:193] '' --> ' '", + "insert text[107:107] --> decoded_text[194:195] '' --> ' '", + "insert text[108:108] --> decoded_text[196:197] '' --> ' '", + "replace text[109:110] --> decoded_text[198:201] '的' --> ' 的 '", + "insert text[111:111] --> decoded_text[202:203] '' --> ' '", + "insert text[112:112] --> decoded_text[204:205] '' --> ' '", + "replace text[113:114] --> decoded_text[206:209] ',' --> ' , '", + "insert text[115:115] --> decoded_text[210:211] '' --> ' '", + "insert text[116:116] --> decoded_text[212:213] '' --> ' '", + "insert text[117:117] --> decoded_text[214:215] '' --> ' '", + "insert text[118:118] --> decoded_text[216:217] '' --> ' '", + "insert text[119:119] --> decoded_text[218:219] '' --> ' '", + "insert text[120:120] --> decoded_text[220:221] '' --> ' '", + "insert text[121:121] --> decoded_text[222:223] '' --> ' '", + "insert text[122:122] --> decoded_text[224:225] '' --> ' '", + "insert text[123:123] --> decoded_text[226:227] '' --> ' '", + "insert text[124:124] --> decoded_text[228:229] '' --> ' '", + "insert text[125:125] --> decoded_text[230:231] '' --> ' '", + "insert text[126:126] --> decoded_text[232:233] '' --> ' '", + "insert text[127:127] --> decoded_text[234:235] '' --> ' '", + "insert text[128:128] --> decoded_text[236:237] '' --> ' '", + "insert text[129:129] --> decoded_text[238:239] '' --> ' '", + "replace text[130:131] --> decoded_text[240:243] '车' --> ' 车 '", + "replace text[132:133] --> decoded_text[244:246] 'S' --> 's '", + "insert text[134:134] --> decoded_text[247:248] '' --> ' '", + "insert text[135:135] --> decoded_text[249:250] '' --> ' '", + "replace text[136:137] --> decoded_text[251:254] ',' --> ' , '", + "insert text[138:138] --> decoded_text[255:256] '' --> ' '", + "insert text[139:139] --> decoded_text[257:258] '' --> ' '", + "insert text[140:140] --> decoded_text[259:260] '' --> ' '", + "replace text[141:142] --> decoded_text[261:264] '车' --> ' 车 '", + "insert text[143:143] --> decoded_text[265:266] '' --> ' '", + "insert text[144:144] --> decoded_text[267:268] '' --> ' '", + "replace text[145:146] --> decoded_text[269:272] '车' --> ' 车 '", + "insert text[147:147] --> decoded_text[273:274] '' --> ' '", + "replace text[148:149] --> decoded_text[275:278] ',' --> ' , '", + "insert text[150:150] --> decoded_text[279:280] '' --> ' '", + "insert text[151:151] --> decoded_text[281:282] '' --> ' '", + "insert text[152:152] --> decoded_text[283:284] '' --> ' '", + "replace text[153:154] --> decoded_text[285:288] '车' --> ' 车 '", + "insert text[155:155] --> decoded_text[289:290] '' --> ' '", + "insert text[156:156] --> decoded_text[291:292] '' --> ' '", + "insert text[157:157] --> decoded_text[293:294] '' --> ' '", + "insert text[158:158] --> decoded_text[295:296] '' --> ' '", + "insert text[159:159] --> decoded_text[297:298] '' --> ' '", + "insert text[163:163] --> decoded_text[302:303] '' --> ' '", + "insert text[164:164] --> decoded_text[304:305] '' --> ' '", + "insert text[165:165] --> decoded_text[306:307] '' --> ' '", + "insert text[166:166] --> decoded_text[308:309] '' --> ' '", + "insert text[167:167] --> decoded_text[310:311] '' --> ' '", + "replace text[168:169] --> decoded_text[312:315] ',' --> ' , '", + "insert text[170:170] --> decoded_text[316:317] '' --> ' '", + "replace text[171:173] --> decoded_text[318:323] '的车' --> ' 的 车 '", + "insert text[174:174] --> decoded_text[324:325] '' --> ' '", + "insert text[175:175] --> decoded_text[326:327] '' --> ' '", + "insert text[176:176] --> decoded_text[328:329] '' --> ' '", + "insert text[177:177] --> decoded_text[330:331] '' --> ' '", + "insert text[178:178] --> decoded_text[332:333] '' --> ' '", + "insert text[179:179] --> decoded_text[334:335] '' --> ' '", + "insert text[180:180] --> decoded_text[336:337] '' --> ' '", + "insert text[181:181] --> decoded_text[338:339] '' --> ' '", + "insert text[182:182] --> decoded_text[340:341] '' --> ' '", + "replace text[183:184] --> decoded_text[342:345] ',' --> ' , '", + "insert text[185:185] --> decoded_text[346:347] '' --> ' '", + "insert text[186:186] --> decoded_text[348:349] '' --> ' '", + "insert text[187:187] --> decoded_text[350:351] '' --> ' '", + "insert text[188:188] --> decoded_text[352:353] '' --> ' '", + "replace text[189:190] --> decoded_text[354:357] '的' --> ' 的 '", + "insert text[191:191] --> decoded_text[358:359] '' --> ' '", + "insert text[192:192] --> decoded_text[360:361] '' --> ' '", + "insert text[193:193] --> decoded_text[362:363] '' --> ' '", + "insert text[194:194] --> decoded_text[364:365] '' --> ' '", + "insert text[195:195] --> decoded_text[366:367] '' --> ' '", + "insert text[196:196] --> decoded_text[368:369] '' --> ' '", + "insert text[206:206] --> decoded_text[379:380] '' --> ' '", + "insert text[207:207] --> decoded_text[381:382] '' --> ' '", + "insert text[211:211] --> decoded_text[386:387] '' --> ' '", + "insert text[212:212] --> decoded_text[388:389] '' --> ' '", + "insert text[213:213] --> decoded_text[390:391] '' --> ' '" + ], + "n_oov_chars": 1, + "oov_ratio": 0.004672897196261682, + "oov_charset": "[\"S\"]" + }, + { + "text": "一个类似美国大片《幸福终点站》的案例令中国驻圣彼得堡领事官胡滨印象深刻。由于行前未能仔细核对签证有效期,一对赴俄罗斯旅游的中国夫妇因为签证过期差点被困在俄罗斯。在胡滨的协助下,这对夫妇经历了惊心动魄的3小时,终于在飞机起飞前5分钟,登上返程的航班。", + "decoded_text": "一 个 类 似 美 国 大 片 《 幸 福 终 点 站 》 的 案 例 令 中 国 驻 圣 彼 得 堡 领 事 官 胡 滨 印 象 深 刻 。 由 于 行 前 未 能 仔 细 核 对 签 证 有 效 期 , 一 对 赴 俄 罗 斯 旅 游 的 中 国 夫 妇 因 为 签 证 过 期 差 点 被 困 在 俄 罗 斯 。 在 胡 滨 的 协 助 下 , 这 对 夫 妇 经 历 了 惊 心 动 魄 的 3 小 时 , 终 于 在 飞 �� 起 飞 前 5 分 钟 , 登 上 返 程 的 航 班 。", + "diff": [ + "insert text[1:1] --> decoded_text[1:2] '' --> ' '", + "insert text[2:2] --> decoded_text[3:4] '' --> ' '", + "insert text[3:3] --> decoded_text[5:6] '' --> ' '", + "insert text[4:4] --> decoded_text[7:8] '' --> ' '", + "insert text[5:5] --> decoded_text[9:10] '' --> ' '", + "insert text[6:6] --> decoded_text[11:12] '' --> ' '", + "insert text[7:7] --> decoded_text[13:14] '' --> ' '", + "insert text[8:8] --> decoded_text[15:16] '' --> ' '", + "insert text[9:9] --> decoded_text[17:18] '' --> ' '", + "insert text[10:10] --> decoded_text[19:20] '' --> ' '", + "insert text[11:11] --> decoded_text[21:22] '' --> ' '", + "insert text[12:12] --> decoded_text[23:24] '' --> ' '", + "insert text[13:13] --> decoded_text[25:26] '' --> ' '", + "insert text[14:14] --> decoded_text[27:28] '' --> ' '", + "replace text[15:16] --> decoded_text[29:32] '的' --> ' 的 '", + "insert text[17:17] --> decoded_text[33:34] '' --> ' '", + "insert text[18:18] --> decoded_text[35:36] '' --> ' '", + "insert text[19:19] --> decoded_text[37:38] '' --> ' '", + "insert text[20:20] --> decoded_text[39:40] '' --> ' '", + "insert text[21:21] --> decoded_text[41:42] '' --> ' '", + "insert text[22:22] --> decoded_text[43:44] '' --> ' '", + "insert text[23:23] --> decoded_text[45:46] '' --> ' '", + "insert text[24:24] --> decoded_text[47:48] '' --> ' '", + "insert text[25:25] --> decoded_text[49:50] '' --> ' '", + "insert text[26:26] --> decoded_text[51:52] '' --> ' '", + "insert text[27:27] --> decoded_text[53:54] '' --> ' '", + "insert text[28:28] --> decoded_text[55:56] '' --> ' '", + "insert text[29:29] --> decoded_text[57:58] '' --> ' '", + "insert text[30:30] --> decoded_text[59:60] '' --> ' '", + "insert text[31:31] --> decoded_text[61:62] '' --> ' '", + "insert text[32:32] --> decoded_text[63:64] '' --> ' '", + "insert text[33:33] --> decoded_text[65:66] '' --> ' '", + "insert text[34:34] --> decoded_text[67:68] '' --> ' '", + "insert text[35:35] --> decoded_text[69:70] '' --> ' '", + "insert text[36:36] --> decoded_text[71:72] '' --> ' '", + "insert text[37:37] --> decoded_text[73:74] '' --> ' '", + "insert text[38:38] --> decoded_text[75:76] '' --> ' '", + "insert text[39:39] --> decoded_text[77:78] '' --> ' '", + "insert text[40:40] --> decoded_text[79:80] '' --> ' '", + "insert text[41:41] --> decoded_text[81:82] '' --> ' '", + "insert text[42:42] --> decoded_text[83:84] '' --> ' '", + "insert text[43:43] --> decoded_text[85:86] '' --> ' '", + "insert text[44:44] --> decoded_text[87:88] '' --> ' '", + "insert text[45:45] --> decoded_text[89:90] '' --> ' '", + "insert text[46:46] --> decoded_text[91:92] '' --> ' '", + "insert text[47:47] --> decoded_text[93:94] '' --> ' '", + "insert text[48:48] --> decoded_text[95:96] '' --> ' '", + "insert text[49:49] --> decoded_text[97:98] '' --> ' '", + "insert text[50:50] --> decoded_text[99:100] '' --> ' '", + "replace text[51:52] --> decoded_text[101:104] ',' --> ' , '", + "insert text[53:53] --> decoded_text[105:106] '' --> ' '", + "insert text[54:54] --> decoded_text[107:108] '' --> ' '", + "insert text[55:55] --> decoded_text[109:110] '' --> ' '", + "insert text[56:56] --> decoded_text[111:112] '' --> ' '", + "insert text[57:57] --> decoded_text[113:114] '' --> ' '", + "insert text[58:58] --> decoded_text[115:116] '' --> ' '", + "insert text[59:59] --> decoded_text[117:118] '' --> ' '", + "replace text[60:61] --> decoded_text[119:122] '的' --> ' 的 '", + "insert text[62:62] --> decoded_text[123:124] '' --> ' '", + "insert text[63:63] --> decoded_text[125:126] '' --> ' '", + "insert text[64:64] --> decoded_text[127:128] '' --> ' '", + "insert text[65:65] --> decoded_text[129:130] '' --> ' '", + "insert text[66:66] --> decoded_text[131:132] '' --> ' '", + "insert text[67:67] --> decoded_text[133:134] '' --> ' '", + "insert text[68:68] --> decoded_text[135:136] '' --> ' '", + "insert text[69:69] --> decoded_text[137:138] '' --> ' '", + "insert text[70:70] --> decoded_text[139:140] '' --> ' '", + "insert text[71:71] --> decoded_text[141:142] '' --> ' '", + "insert text[72:72] --> decoded_text[143:144] '' --> ' '", + "insert text[73:73] --> decoded_text[145:146] '' --> ' '", + "insert text[74:74] --> decoded_text[147:148] '' --> ' '", + "insert text[75:75] --> decoded_text[149:150] '' --> ' '", + "insert text[76:76] --> decoded_text[151:152] '' --> ' '", + "insert text[77:77] --> decoded_text[153:154] '' --> ' '", + "insert text[78:78] --> decoded_text[155:156] '' --> ' '", + "insert text[79:79] --> decoded_text[157:158] '' --> ' '", + "insert text[80:80] --> decoded_text[159:160] '' --> ' '", + "insert text[81:81] --> decoded_text[161:162] '' --> ' '", + "insert text[82:82] --> decoded_text[163:164] '' --> ' '", + "replace text[83:84] --> decoded_text[165:168] '的' --> ' 的 '", + "insert text[85:85] --> decoded_text[169:170] '' --> ' '", + "insert text[86:86] --> decoded_text[171:172] '' --> ' '", + "replace text[87:88] --> decoded_text[173:176] ',' --> ' , '", + "insert text[89:89] --> decoded_text[177:178] '' --> ' '", + "insert text[90:90] --> decoded_text[179:180] '' --> ' '", + "insert text[91:91] --> decoded_text[181:182] '' --> ' '", + "insert text[92:92] --> decoded_text[183:184] '' --> ' '", + "insert text[93:93] --> decoded_text[185:186] '' --> ' '", + "insert text[94:94] --> decoded_text[187:188] '' --> ' '", + "insert text[95:95] --> decoded_text[189:190] '' --> ' '", + "insert text[96:96] --> decoded_text[191:192] '' --> ' '", + "insert text[97:97] --> decoded_text[193:194] '' --> ' '", + "insert text[98:98] --> decoded_text[195:196] '' --> ' '", + "replace text[99:100] --> decoded_text[197:200] '的' --> ' 的 '", + "insert text[101:101] --> decoded_text[201:202] '' --> ' '", + "insert text[102:102] --> decoded_text[203:204] '' --> ' '", + "replace text[103:104] --> decoded_text[205:208] ',' --> ' , '", + "insert text[105:105] --> decoded_text[209:210] '' --> ' '", + "insert text[106:106] --> decoded_text[211:212] '' --> ' '", + "insert text[107:107] --> decoded_text[213:214] '' --> ' '", + "insert text[108:108] --> decoded_text[215:216] '' --> ' '", + "insert text[109:109] --> decoded_text[217:218] '' --> ' '", + "insert text[110:110] --> decoded_text[219:220] '' --> ' '", + "insert text[111:111] --> decoded_text[221:222] '' --> ' '", + "insert text[112:112] --> decoded_text[223:224] '' --> ' '", + "insert text[113:113] --> decoded_text[225:226] '' --> ' '", + "insert text[114:114] --> decoded_text[227:228] '' --> ' '", + "replace text[115:116] --> decoded_text[229:232] ',' --> ' , '", + "insert text[117:117] --> decoded_text[233:234] '' --> ' '", + "insert text[118:118] --> decoded_text[235:236] '' --> ' '", + "insert text[119:119] --> decoded_text[237:238] '' --> ' '", + "replace text[120:121] --> decoded_text[239:242] '的' --> ' 的 '", + "insert text[122:122] --> decoded_text[243:244] '' --> ' '", + "insert text[123:123] --> decoded_text[245:246] '' --> ' '" + ], + "n_oov_chars": 0, + "oov_ratio": 0.0, + "oov_charset": "[]" + }, + { + "text": "招财带什么佛牌张德江在致辞中表示,中法建交开启了中法两个伟大国家友好关系的新纪元,树立了不同社会制度国家和平共处的新典范,对国际战略格局产生了重大而深远的影响。", + "decoded_text": "招 财 带 什 么 佛 牌 张 德 江 在 致 辞 中 表 示 , 中 法 建 交 开 启 了 中 法 两 个 伟 大 国 家 友 好 关 系 的 新 纪 元 , 树 立 了 不 同 社 会 制 度 国 家 和 平 共 处 的 新 典 范 , 对 国 际 战 略 格 局 产 生 了 重 大 而 深 远 的 影 响 。", + "diff": [ + "insert text[1:1] --> decoded_text[1:2] '' --> ' '", + "insert text[2:2] --> decoded_text[3:4] '' --> ' '", + "insert text[3:3] --> decoded_text[5:6] '' --> ' '", + "insert text[4:4] --> decoded_text[7:8] '' --> ' '", + "insert text[5:5] --> decoded_text[9:10] '' --> ' '", + "insert text[6:6] --> decoded_text[11:12] '' --> ' '", + "insert text[7:7] --> decoded_text[13:14] '' --> ' '", + "insert text[8:8] --> decoded_text[15:16] '' --> ' '", + "insert text[9:9] --> decoded_text[17:18] '' --> ' '", + "insert text[10:10] --> decoded_text[19:20] '' --> ' '", + "insert text[11:11] --> decoded_text[21:22] '' --> ' '", + "insert text[12:12] --> decoded_text[23:24] '' --> ' '", + "insert text[13:13] --> decoded_text[25:26] '' --> ' '", + "insert text[14:14] --> decoded_text[27:28] '' --> ' '", + "insert text[15:15] --> decoded_text[29:30] '' --> ' '", + "insert text[16:16] --> decoded_text[31:32] '' --> ' '", + "insert text[17:17] --> decoded_text[33:34] '' --> ' '", + "insert text[18:18] --> decoded_text[35:36] '' --> ' '", + "insert text[19:19] --> decoded_text[37:38] '' --> ' '", + "insert text[20:20] --> decoded_text[39:40] '' --> ' '", + "insert text[21:21] --> decoded_text[41:42] '' --> ' '", + "insert text[22:22] --> decoded_text[43:44] '' --> ' '", + "insert text[23:23] --> decoded_text[45:46] '' --> ' '", + "insert text[24:24] --> decoded_text[47:48] '' --> ' '", + "insert text[25:25] --> decoded_text[49:50] '' --> ' '", + "insert text[26:26] --> decoded_text[51:52] '' --> ' '", + "insert text[27:27] --> decoded_text[53:54] '' --> ' '", + "insert text[28:28] --> decoded_text[55:56] '' --> ' '", + "insert text[29:29] --> decoded_text[57:58] '' --> ' '", + "insert text[30:30] --> decoded_text[59:60] '' --> ' '", + "insert text[31:31] --> decoded_text[61:62] '' --> ' '", + "insert text[32:32] --> decoded_text[63:64] '' --> ' '", + "insert text[33:33] --> decoded_text[65:66] '' --> ' '", + "insert text[34:34] --> decoded_text[67:68] '' --> ' '", + "insert text[35:35] --> decoded_text[69:70] '' --> ' '", + "insert text[36:36] --> decoded_text[71:72] '' --> ' '", + "insert text[37:37] --> decoded_text[73:74] '' --> ' '", + "insert text[38:38] --> decoded_text[75:76] '' --> ' '", + "insert text[39:39] --> decoded_text[77:78] '' --> ' '", + "insert text[40:40] --> decoded_text[79:80] '' --> ' '", + "insert text[41:41] --> decoded_text[81:82] '' --> ' '", + "insert text[42:42] --> decoded_text[83:84] '' --> ' '", + "insert text[43:43] --> decoded_text[85:86] '' --> ' '", + "insert text[44:44] --> decoded_text[87:88] '' --> ' '", + "insert text[45:45] --> decoded_text[89:90] '' --> ' '", + "insert text[46:46] --> decoded_text[91:92] '' --> ' '", + "insert text[47:47] --> decoded_text[93:94] '' --> ' '", + "insert text[48:48] --> decoded_text[95:96] '' --> ' '", + "insert text[49:49] --> decoded_text[97:98] '' --> ' '", + "insert text[50:50] --> decoded_text[99:100] '' --> ' '", + "insert text[51:51] --> decoded_text[101:102] '' --> ' '", + "insert text[52:52] --> decoded_text[103:104] '' --> ' '", + "insert text[53:53] --> decoded_text[105:106] '' --> ' '", + "insert text[54:54] --> decoded_text[107:108] '' --> ' '", + "insert text[55:55] --> decoded_text[109:110] '' --> ' '", + "insert text[56:56] --> decoded_text[111:112] '' --> ' '", + "insert text[57:57] --> decoded_text[113:114] '' --> ' '", + "insert text[58:58] --> decoded_text[115:116] '' --> ' '", + "insert text[59:59] --> decoded_text[117:118] '' --> ' '", + "insert text[60:60] --> decoded_text[119:120] '' --> ' '", + "insert text[61:61] --> decoded_text[121:122] '' --> ' '", + "insert text[62:62] --> decoded_text[123:124] '' --> ' '", + "insert text[63:63] --> decoded_text[125:126] '' --> ' '", + "insert text[64:64] --> decoded_text[127:128] '' --> ' '", + "insert text[65:65] --> decoded_text[129:130] '' --> ' '", + "insert text[66:66] --> decoded_text[131:132] '' --> ' '", + "insert text[67:67] --> decoded_text[133:134] '' --> ' '", + "insert text[68:68] --> decoded_text[135:136] '' --> ' '", + "insert text[69:69] --> decoded_text[137:138] '' --> ' '", + "insert text[70:70] --> decoded_text[139:140] '' --> ' '", + "insert text[71:71] --> decoded_text[141:142] '' --> ' '", + "insert text[72:72] --> decoded_text[143:144] '' --> ' '", + "insert text[73:73] --> decoded_text[145:146] '' --> ' '", + "insert text[74:74] --> decoded_text[147:148] '' --> ' '", + "insert text[75:75] --> decoded_text[149:150] '' --> ' '", + "insert text[76:76] --> decoded_text[151:152] '' --> ' '", + "insert text[77:77] --> decoded_text[153:154] '' --> ' '", + "insert text[78:78] --> decoded_text[155:156] '' --> ' '", + "insert text[79:79] --> decoded_text[157:158] '' --> ' '" + ], + "n_oov_chars": 0, + "oov_ratio": 0.0, + "oov_charset": "[]" + }, + { + "text": "招财带什么佛牌科斯格罗夫一直供职于军队,曾被派往马来西亚、越南、英国、印度、美国工作。1999年,他成为联��国驻东帝汶部队司令,监督东帝汶向独立国家的过渡。", + "decoded_text": "招 财 带 什 么 佛 牌 科 斯 格 罗 夫 一 直 供 职 于 军 队 , 曾 被 派 往 马 来 西 亚 、 越 南 、 英 国 、 印 度 、 美 国 工 作 。 1999 年 , 他 成 为 联 合 国 驻 东 帝 汶 部 队 司 令 , 监 督 东 帝 汶 向 独 立 国 家 的 过 渡 。", + "diff": [ + "insert text[1:1] --> decoded_text[1:2] '' --> ' '", + "insert text[2:2] --> decoded_text[3:4] '' --> ' '", + "insert text[3:3] --> decoded_text[5:6] '' --> ' '", + "insert text[4:4] --> decoded_text[7:8] '' --> ' '", + "insert text[5:5] --> decoded_text[9:10] '' --> ' '", + "insert text[6:6] --> decoded_text[11:12] '' --> ' '", + "insert text[7:7] --> decoded_text[13:14] '' --> ' '", + "insert text[8:8] --> decoded_text[15:16] '' --> ' '", + "insert text[9:9] --> decoded_text[17:18] '' --> ' '", + "insert text[10:10] --> decoded_text[19:20] '' --> ' '", + "insert text[11:11] --> decoded_text[21:22] '' --> ' '", + "insert text[12:12] --> decoded_text[23:24] '' --> ' '", + "insert text[13:13] --> decoded_text[25:26] '' --> ' '", + "insert text[14:14] --> decoded_text[27:28] '' --> ' '", + "insert text[15:15] --> decoded_text[29:30] '' --> ' '", + "insert text[16:16] --> decoded_text[31:32] '' --> ' '", + "insert text[17:17] --> decoded_text[33:34] '' --> ' '", + "insert text[18:18] --> decoded_text[35:36] '' --> ' '", + "insert text[19:19] --> decoded_text[37:38] '' --> ' '", + "insert text[20:20] --> decoded_text[39:40] '' --> ' '", + "insert text[21:21] --> decoded_text[41:42] '' --> ' '", + "insert text[22:22] --> decoded_text[43:44] '' --> ' '", + "insert text[23:23] --> decoded_text[45:46] '' --> ' '", + "insert text[24:24] --> decoded_text[47:48] '' --> ' '", + "insert text[25:25] --> decoded_text[49:50] '' --> ' '", + "insert text[26:26] --> decoded_text[51:52] '' --> ' '", + "insert text[27:27] --> decoded_text[53:54] '' --> ' '", + "insert text[28:28] --> decoded_text[55:56] '' --> ' '", + "insert text[29:29] --> decoded_text[57:58] '' --> ' '", + "insert text[30:30] --> decoded_text[59:60] '' --> ' '", + "insert text[31:31] --> decoded_text[61:62] '' --> ' '", + "insert text[32:32] --> decoded_text[63:64] '' --> ' '", + "insert text[33:33] --> decoded_text[65:66] '' --> ' '", + "insert text[34:34] --> decoded_text[67:68] '' --> ' '", + "insert text[35:35] --> decoded_text[69:70] '' --> ' '", + "insert text[36:36] --> decoded_text[71:72] '' --> ' '", + "insert text[37:37] --> decoded_text[73:74] '' --> ' '", + "insert text[38:38] --> decoded_text[75:76] '' --> ' '", + "insert text[39:39] --> decoded_text[77:78] '' --> ' '", + "insert text[40:40] --> decoded_text[79:80] '' --> ' '", + "insert text[41:41] --> decoded_text[81:82] '' --> ' '", + "insert text[42:42] --> decoded_text[83:84] '' --> ' '", + "insert text[43:43] --> decoded_text[85:86] '' --> ' '", + "insert text[47:47] --> decoded_text[90:91] '' --> ' '", + "insert text[48:48] --> decoded_text[92:93] '' --> ' '", + "insert text[49:49] --> decoded_text[94:95] '' --> ' '", + "insert text[50:50] --> decoded_text[96:97] '' --> ' '", + "insert text[51:51] --> decoded_text[98:99] '' --> ' '", + "insert text[52:52] --> decoded_text[100:101] '' --> ' '", + "insert text[53:53] --> decoded_text[102:103] '' --> ' '", + "insert text[54:54] --> decoded_text[104:105] '' --> ' '", + "insert text[55:55] --> decoded_text[106:107] '' --> ' '", + "insert text[56:56] --> decoded_text[108:109] '' --> ' '", + "insert text[57:57] --> decoded_text[110:111] '' --> ' '", + "insert text[58:58] --> decoded_text[112:113] '' --> ' '", + "insert text[59:59] --> decoded_text[114:115] '' --> ' '", + "insert text[60:60] --> decoded_text[116:117] '' --> ' '", + "insert text[61:61] --> decoded_text[118:119] '' --> ' '", + "insert text[62:62] --> decoded_text[120:121] '' --> ' '", + "insert text[63:63] --> decoded_text[122:123] '' --> ' '", + "insert text[64:64] --> decoded_text[124:125] '' --> ' '", + "insert text[65:65] --> decoded_text[126:127] '' --> ' '", + "insert text[66:66] --> decoded_text[128:129] '' --> ' '", + "insert text[67:67] --> decoded_text[130:131] '' --> ' '", + "insert text[68:68] --> decoded_text[132:133] '' --> ' '", + "insert text[69:69] --> decoded_text[134:135] '' --> ' '", + "insert text[70:70] --> decoded_text[136:137] '' --> ' '", + "insert text[71:71] --> decoded_text[138:139] '' --> ' '", + "insert text[72:72] --> decoded_text[140:141] '' --> ' '", + "insert text[73:73] --> decoded_text[142:143] '' --> ' '", + "insert text[74:74] --> decoded_text[144:145] '' --> ' '", + "insert text[75:75] --> decoded_text[146:147] '' --> ' '", + "insert text[76:76] --> decoded_text[148:149] '' --> ' '", + "insert text[77:77] --> decoded_text[150:151] '' --> ' '" + ], + "n_oov_chars": 0, + "oov_ratio": 0.0, + "oov_charset": "[]" + }, + { + "text": "1月28日电据香港《明报》消息,在庆祝披头士进军美国音乐市场50周年的纪念日子,格莱美向两名仅存成员:保罗麦卡尼及灵高史达(RingoStarr)颁发终身成就奖,显得别具意义。为了隆重其事,大会请来金像影后茱莉亚••罗伯茨(JuliaRoberts)负责介绍二人出场,保罗在拍档的鼓声和应下,先献唱新歌《QueenieEye》,然后轮到后者演绎旧作《Photograph》,带领歌迷重温昔日的美好情怀。", + "decoded_text": "1 月 28 日 电 据 香 港 《 明 报 》 消 息 , 在 庆 祝 披 头 士 进 军 美 国 音 乐 市 场 50 周 年 的 纪 念 日 子 , 格 莱 美 向 两 名 仅 存 成 员 : 保 罗 麦 卡 尼 及 灵 高 史 达 ( ringostarr ) 颁 发 终 身 成 就 奖 , 显 得 别 具 意 义 。 为 了 隆 重 其 事 , 大 会 请 来 金 像 影 后 茱 莉 亚 • • 罗 伯 茨 ( juliaroberts ) 负 责 介 绍 二 人 出 场 , 保 罗 在 拍 档 的 鼓 声 和 应 下 , 先 献 唱 新 歌 《 queenieeye 》 , 然 后 轮 到 后 者 演 绎 旧 作 《 photograph 》 , 带 领 歌 迷 重 温 昔 日 的 美 好 情 怀 。", + "diff": [ + "insert text[1:1] --> decoded_text[1:2] '' --> ' '", + "insert text[2:2] --> decoded_text[3:4] '' --> ' '", + "insert text[4:4] --> decoded_text[6:7] '' --> ' '", + "insert text[5:5] --> decoded_text[8:9] '' --> ' '", + "insert text[6:6] --> decoded_text[10:11] '' --> ' '", + "insert text[7:7] --> decoded_text[12:13] '' --> ' '", + "insert text[8:8] --> decoded_text[14:15] '' --> ' '", + "insert text[9:9] --> decoded_text[16:17] '' --> ' '", + "insert text[10:10] --> decoded_text[18:19] '' --> ' '", + "insert text[11:11] --> decoded_text[20:21] '' --> ' '", + "insert text[12:12] --> decoded_text[22:23] '' --> ' '", + "insert text[13:13] --> decoded_text[24:25] '' --> ' '", + "insert text[14:14] --> decoded_text[26:27] '' --> ' '", + "replace text[15:16] --> decoded_text[28:31] ',' --> ' , '", + "insert text[17:17] --> decoded_text[32:33] '' --> ' '", + "insert text[18:18] --> decoded_text[34:35] '' --> ' '", + "insert text[19:19] --> decoded_text[36:37] '' --> ' '", + "insert text[20:20] --> decoded_text[38:39] '' --> ' '", + "insert text[21:21] --> decoded_text[40:41] '' --> ' '", + "insert text[22:22] --> decoded_text[42:43] '' --> ' '", + "insert text[23:23] --> decoded_text[44:45] '' --> ' '", + "insert text[24:24] --> decoded_text[46:47] '' --> ' '", + "insert text[25:25] --> decoded_text[48:49] '' --> ' '", + "insert text[26:26] --> decoded_text[50:51] '' --> ' '", + "insert text[27:27] --> decoded_text[52:53] '' --> ' '", + "insert text[28:28] --> decoded_text[54:55] '' --> ' '", + "insert text[29:29] --> decoded_text[56:57] '' --> ' '", + "insert text[30:30] --> decoded_text[58:59] '' --> ' '", + "insert text[32:32] --> decoded_text[61:62] '' --> ' '", + "insert text[33:33] --> decoded_text[63:64] '' --> ' '", + "insert text[34:34] --> decoded_text[65:66] '' --> ' '", + "insert text[35:35] --> decoded_text[67:68] '' --> ' '", + "insert text[36:36] --> decoded_text[69:70] '' --> ' '", + "insert text[37:37] --> decoded_text[71:72] '' --> ' '", + "insert text[38:38] --> decoded_text[73:74] '' --> ' '", + "replace text[39:40] --> decoded_text[75:78] ',' --> ' , '", + "insert text[41:41] --> decoded_text[79:80] '' --> ' '", + "insert text[42:42] --> decoded_text[81:82] '' --> ' '", + "insert text[43:43] --> decoded_text[83:84] '' --> ' '", + "insert text[44:44] --> decoded_text[85:86] '' --> ' '", + "insert text[45:45] --> decoded_text[87:88] '' --> ' '", + "insert text[46:46] --> decoded_text[89:90] '' --> ' '", + "insert text[47:47] --> decoded_text[91:92] '' --> ' '", + "insert text[48:48] --> decoded_text[93:94] '' --> ' '", + "insert text[49:49] --> decoded_text[95:96] '' --> ' '", + "insert text[50:50] --> decoded_text[97:98] '' --> ' '", + "insert text[51:51] --> decoded_text[99:100] '' --> ' '", + "insert text[52:52] --> decoded_text[101:102] '' --> ' '", + "insert text[53:53] --> decoded_text[103:104] '' --> ' '", + "insert text[54:54] --> decoded_text[105:106] '' --> ' '", + "insert text[55:55] --> decoded_text[107:108] '' --> ' '", + "insert text[56:56] --> decoded_text[109:110] '' --> ' '", + "insert text[57:57] --> decoded_text[111:112] '' --> ' '", + "insert text[58:58] --> decoded_text[113:114] '' --> ' '", + "insert text[59:59] --> decoded_text[115:116] '' --> ' '", + "insert text[60:60] --> decoded_text[117:118] '' --> ' '", + "insert text[61:61] --> decoded_text[119:120] '' --> ' '", + "replace text[62:63] --> decoded_text[121:123] 'R' --> ' r'", + "replace text[67:68] --> decoded_text[127:128] 'S' --> 's'", + "insert text[72:72] --> decoded_text[132:133] '' --> ' '", + "insert text[73:73] --> decoded_text[134:135] '' --> ' '", + "insert text[74:74] --> decoded_text[136:137] '' --> ' '", + "insert text[75:75] --> decoded_text[138:139] '' --> ' '", + "insert text[76:76] --> decoded_text[140:141] '' --> ' '", + "insert text[77:77] --> decoded_text[142:143] '' --> ' '", + "insert text[78:78] --> decoded_text[144:145] '' --> ' '", + "insert text[79:79] --> decoded_text[146:147] '' --> ' '", + "replace text[80:81] --> decoded_text[148:151] ',' --> ' , '", + "insert text[82:82] --> decoded_text[152:153] '' --> ' '", + "insert text[83:83] --> decoded_text[154:155] '' --> ' '", + "insert text[84:84] --> decoded_text[156:157] '' --> ' '", + "insert text[85:85] --> decoded_text[158:159] '' --> ' '", + "insert text[86:86] --> decoded_text[160:161] '' --> ' '", + "insert text[87:87] --> decoded_text[162:163] '' --> ' '", + "insert text[88:88] --> decoded_text[164:165] '' --> ' '", + "insert text[89:89] --> decoded_text[166:167] '' --> ' '", + "insert text[90:90] --> decoded_text[168:169] '' --> ' '", + "insert text[91:91] --> decoded_text[170:171] '' --> ' '", + "insert text[92:92] --> decoded_text[172:173] '' --> ' '", + "insert text[93:93] --> decoded_text[174:175] '' --> ' '", + "replace text[94:95] --> decoded_text[176:179] ',' --> ' , '", + "insert text[96:96] --> decoded_text[180:181] '' --> ' '", + "insert text[97:97] --> decoded_text[182:183] '' --> ' '", + "insert text[98:98] --> decoded_text[184:185] '' --> ' '", + "insert text[99:99] --> decoded_text[186:187] '' --> ' '", + "insert text[100:100] --> decoded_text[188:189] '' --> ' '", + "insert text[101:101] --> decoded_text[190:191] '' --> ' '", + "insert text[102:102] --> decoded_text[192:193] '' --> ' '", + "insert text[103:103] --> decoded_text[194:195] '' --> ' '", + "insert text[104:104] --> decoded_text[196:197] '' --> ' '", + "insert text[105:105] --> decoded_text[198:199] '' --> ' '", + "insert text[106:106] --> decoded_text[200:201] '' --> ' '", + "insert text[107:107] --> decoded_text[202:203] '' --> ' '", + "insert text[108:108] --> decoded_text[204:205] '' --> ' '", + "insert text[109:109] --> decoded_text[206:207] '' --> ' '", + "insert text[110:110] --> decoded_text[208:209] '' --> ' '", + "insert text[111:111] --> decoded_text[210:211] '' --> ' '", + "replace text[112:113] --> decoded_text[212:214] 'J' --> ' j'", + "replace text[117:118] --> decoded_text[218:219] 'R' --> 'r'", + "insert text[124:124] --> decoded_text[225:226] '' --> ' '", + "insert text[125:125] --> decoded_text[227:228] '' --> ' '", + "insert text[126:126] --> decoded_text[229:230] '' --> ' '", + "insert text[127:127] --> decoded_text[231:232] '' --> ' '", + "insert text[128:128] --> decoded_text[233:234] '' --> ' '", + "insert text[129:129] --> decoded_text[235:236] '' --> ' '", + "insert text[130:130] --> decoded_text[237:238] '' --> ' '", + "insert text[131:131] --> decoded_text[239:240] '' --> ' '", + "insert text[132:132] --> decoded_text[241:242] '' --> ' '", + "replace text[133:134] --> decoded_text[243:246] ',' --> ' , '", + "insert text[135:135] --> decoded_text[247:248] '' --> ' '", + "insert text[136:136] --> decoded_text[249:250] '' --> ' '", + "insert text[137:137] --> decoded_text[251:252] '' --> ' '", + "insert text[138:138] --> decoded_text[253:254] '' --> ' '", + "insert text[139:139] --> decoded_text[255:256] '' --> ' '", + "insert text[140:140] --> decoded_text[257:258] '' --> ' '", + "insert text[141:141] --> decoded_text[259:260] '' --> ' '", + "insert text[142:142] --> decoded_text[261:262] '' --> ' '", + "insert text[143:143] --> decoded_text[263:264] '' --> ' '", + "insert text[144:144] --> decoded_text[265:266] '' --> ' '", + "replace text[145:146] --> decoded_text[267:270] ',' --> ' , '", + "insert text[147:147] --> decoded_text[271:272] '' --> ' '", + "insert text[148:148] --> decoded_text[273:274] '' --> ' '", + "insert text[149:149] --> decoded_text[275:276] '' --> ' '", + "insert text[150:150] --> decoded_text[277:278] '' --> ' '", + "insert text[151:151] --> decoded_text[279:280] '' --> ' '", + "replace text[152:153] --> decoded_text[281:283] 'Q' --> ' q'", + "replace text[159:160] --> decoded_text[289:290] 'E' --> 'e'", + "insert text[162:162] --> decoded_text[292:293] '' --> ' '", + "replace text[163:164] --> decoded_text[294:297] ',' --> ' , '", + "insert text[165:165] --> decoded_text[298:299] '' --> ' '", + "insert text[166:166] --> decoded_text[300:301] '' --> ' '", + "insert text[167:167] --> decoded_text[302:303] '' --> ' '", + "insert text[168:168] --> decoded_text[304:305] '' --> ' '", + "insert text[169:169] --> decoded_text[306:307] '' --> ' '", + "insert text[170:170] --> decoded_text[308:309] '' --> ' '", + "insert text[171:171] --> decoded_text[310:311] '' --> ' '", + "insert text[172:172] --> decoded_text[312:313] '' --> ' '", + "insert text[173:173] --> decoded_text[314:315] '' --> ' '", + "insert text[174:174] --> decoded_text[316:317] '' --> ' '", + "replace text[175:176] --> decoded_text[318:320] 'P' --> ' p'", + "insert text[185:185] --> decoded_text[329:330] '' --> ' '", + "replace text[186:187] --> decoded_text[331:334] ',' --> ' , '", + "insert text[188:188] --> decoded_text[335:336] '' --> ' '", + "insert text[189:189] --> decoded_text[337:338] '' --> ' '", + "insert text[190:190] --> decoded_text[339:340] '' --> ' '", + "insert text[191:191] --> decoded_text[341:342] '' --> ' '", + "insert text[192:192] --> decoded_text[343:344] '' --> ' '", + "insert text[193:193] --> decoded_text[345:346] '' --> ' '", + "insert text[194:194] --> decoded_text[347:348] '' --> ' '", + "insert text[195:195] --> decoded_text[349:350] '' --> ' '", + "insert text[196:196] --> decoded_text[351:352] '' --> ' '", + "insert text[197:197] --> decoded_text[353:354] '' --> ' '", + "insert text[198:198] --> decoded_text[355:356] '' --> ' '", + "insert text[199:199] --> decoded_text[357:358] '' --> ' '", + "insert text[200:200] --> decoded_text[359:360] '' --> ' '" + ], + "n_oov_chars": 7, + "oov_ratio": 0.03482587064676617, + "oov_charset": "[\"R\", \"S\", \"J\", \"Q\", \"E\", \"P\"]" + }, + { + "text": "佛牌绳哪里有卖到达目的地后,记者全程的总车费是14元,但司机到账21元,因此,司机给记者7元,除去之前支付的1元,记者净赚6元,还免费乘了本应支付14元的车。", + "decoded_text": "佛 牌 绳 哪 里 有 卖 到 达 目 的 地 后 , 记 者 全 程 的 总 车 费 是 14 元 , 但 司 机 到 账 21 元 , 因 此 , 司 机 给 记 者 7 元 , 除 去 之 前 支 付 的 1 元 , 记 者 净 赚 6 元 , 还 免 费 乘 了 本 应 支 付 14 元 的 车 。", + "diff": [ + "insert text[1:1] --> decoded_text[1:2] '' --> ' '", + "insert text[2:2] --> decoded_text[3:4] '' --> ' '", + "insert text[3:3] --> decoded_text[5:6] '' --> ' '", + "insert text[4:4] --> decoded_text[7:8] '' --> ' '", + "insert text[5:5] --> decoded_text[9:10] '' --> ' '", + "insert text[6:6] --> decoded_text[11:12] '' --> ' '", + "insert text[7:7] --> decoded_text[13:14] '' --> ' '", + "insert text[8:8] --> decoded_text[15:16] '' --> ' '", + "insert text[9:9] --> decoded_text[17:18] '' --> ' '", + "insert text[10:10] --> decoded_text[19:20] '' --> ' '", + "insert text[11:11] --> decoded_text[21:22] '' --> ' '", + "insert text[12:12] --> decoded_text[23:24] '' --> ' '", + "insert text[13:13] --> decoded_text[25:26] '' --> ' '", + "insert text[14:14] --> decoded_text[27:28] '' --> ' '", + "insert text[15:15] --> decoded_text[29:30] '' --> ' '", + "insert text[16:16] --> decoded_text[31:32] '' --> ' '", + "insert text[17:17] --> decoded_text[33:34] '' --> ' '", + "insert text[18:18] --> decoded_text[35:36] '' --> ' '", + "insert text[19:19] --> decoded_text[37:38] '' --> ' '", + "insert text[20:20] --> decoded_text[39:40] '' --> ' '", + "insert text[21:21] --> decoded_text[41:42] '' --> ' '", + "insert text[22:22] --> decoded_text[43:44] '' --> ' '", + "insert text[23:23] --> decoded_text[45:46] '' --> ' '", + "insert text[25:25] --> decoded_text[48:49] '' --> ' '", + "insert text[26:26] --> decoded_text[50:51] '' --> ' '", + "insert text[27:27] --> decoded_text[52:53] '' --> ' '", + "insert text[28:28] --> decoded_text[54:55] '' --> ' '", + "insert text[29:29] --> decoded_text[56:57] '' --> ' '", + "insert text[30:30] --> decoded_text[58:59] '' --> ' '", + "insert text[31:31] --> decoded_text[60:61] '' --> ' '", + "insert text[32:32] --> decoded_text[62:63] '' --> ' '", + "insert text[34:34] --> decoded_text[65:66] '' --> ' '", + "insert text[35:35] --> decoded_text[67:68] '' --> ' '", + "insert text[36:36] --> decoded_text[69:70] '' --> ' '", + "insert text[37:37] --> decoded_text[71:72] '' --> ' '", + "insert text[38:38] --> decoded_text[73:74] '' --> ' '", + "insert text[39:39] --> decoded_text[75:76] '' --> ' '", + "insert text[40:40] --> decoded_text[77:78] '' --> ' '", + "insert text[41:41] --> decoded_text[79:80] '' --> ' '", + "insert text[42:42] --> decoded_text[81:82] '' --> ' '", + "insert text[43:43] --> decoded_text[83:84] '' --> ' '", + "insert text[44:44] --> decoded_text[85:86] '' --> ' '", + "insert text[45:45] --> decoded_text[87:88] '' --> ' '", + "insert text[46:46] --> decoded_text[89:90] '' --> ' '", + "insert text[47:47] --> decoded_text[91:92] '' --> ' '", + "insert text[48:48] --> decoded_text[93:94] '' --> ' '", + "insert text[49:49] --> decoded_text[95:96] '' --> ' '", + "insert text[50:50] --> decoded_text[97:98] '' --> ' '", + "insert text[51:51] --> decoded_text[99:100] '' --> ' '", + "insert text[52:52] --> decoded_text[101:102] '' --> ' '", + "insert text[53:53] --> decoded_text[103:104] '' --> ' '", + "insert text[54:54] --> decoded_text[105:106] '' --> ' '", + "insert text[55:55] --> decoded_text[107:108] '' --> ' '", + "insert text[56:56] --> decoded_text[109:110] '' --> ' '", + "insert text[57:57] --> decoded_text[111:112] '' --> ' '", + "insert text[58:58] --> decoded_text[113:114] '' --> ' '", + "insert text[59:59] --> decoded_text[115:116] '' --> ' '", + "insert text[60:60] --> decoded_text[117:118] '' --> ' '", + "insert text[61:61] --> decoded_text[119:120] '' --> ' '", + "insert text[62:62] --> decoded_text[121:122] '' --> ' '", + "insert text[63:63] --> decoded_text[123:124] '' --> ' '", + "insert text[64:64] --> decoded_text[125:126] '' --> ' '", + "insert text[65:65] --> decoded_text[127:128] '' --> ' '", + "insert text[66:66] --> decoded_text[129:130] '' --> ' '", + "insert text[67:67] --> decoded_text[131:132] '' --> ' '", + "insert text[68:68] --> decoded_text[133:134] '' --> ' '", + "insert text[69:69] --> decoded_text[135:136] '' --> ' '", + "insert text[70:70] --> decoded_text[137:138] '' --> ' '", + "insert text[71:71] --> decoded_text[139:140] '' --> ' '", + "insert text[72:72] --> decoded_text[141:142] '' --> ' '", + "insert text[73:73] --> decoded_text[143:144] '' --> ' '", + "insert text[75:75] --> decoded_text[146:147] '' --> ' '", + "insert text[76:76] --> decoded_text[148:149] '' --> ' '", + "insert text[77:77] --> decoded_text[150:151] '' --> ' '", + "insert text[78:78] --> decoded_text[152:153] '' --> ' '" + ], + "n_oov_chars": 0, + "oov_ratio": 0.0, + "oov_charset": "[]" + }, + { + "text": "卡尔・斯利姆于2012年加入塔塔汽车公司担任总经理一职,并负责公司在印度及国际市场上除捷豹和路虎以外的业务。这位斯坦福大学的毕业生,曾任通用汽车在中国合资公司的副总裁,上汽通用五菱公司的副总裁以及通用汽车印度公司的总裁。(方赵春)", + "decoded_text": "卡 尔 ・ 斯 利 姆 于 2012 年 加 入 塔 塔 汽 车 公 司 担 任 总 经 理 一 职 , 并 负 责 公 司 在 印 度 及 国 际 市 场 上 除 捷 豹 和 路 虎 以 外 的 业 务 。 这 位 斯 坦 福 大 学 的 毕 业 生 , 曾 任 通 用 汽 车 在 中 国 合 资 公 司 的 副 总 裁 , 上 汽 通 用 五 菱 公 司 的 副 总 裁 以 及 通 用 汽 车 印 度 公 司 的 总 裁 。 ( 方 赵 春 )", + "diff": [ + "insert text[1:1] --> decoded_text[1:2] '' --> ' '", + "insert text[2:2] --> decoded_text[3:4] '' --> ' '", + "insert text[3:3] --> decoded_text[5:6] '' --> ' '", + "insert text[4:4] --> decoded_text[7:8] '' --> ' '", + "insert text[5:5] --> decoded_text[9:10] '' --> ' '", + "insert text[6:6] --> decoded_text[11:12] '' --> ' '", + "insert text[7:7] --> decoded_text[13:14] '' --> ' '", + "insert text[11:11] --> decoded_text[18:19] '' --> ' '", + "insert text[12:12] --> decoded_text[20:21] '' --> ' '", + "insert text[13:13] --> decoded_text[22:23] '' --> ' '", + "insert text[14:14] --> decoded_text[24:25] '' --> ' '", + "insert text[15:15] --> decoded_text[26:27] '' --> ' '", + "replace text[16:17] --> decoded_text[28:31] '汽' --> ' 汽 '", + "replace text[18:20] --> decoded_text[32:37] '公司' --> ' 公 司 '", + "insert text[21:21] --> decoded_text[38:39] '' --> ' '", + "replace text[22:23] --> decoded_text[40:43] '总' --> ' 总 '", + "insert text[24:24] --> decoded_text[44:45] '' --> ' '", + "insert text[25:25] --> decoded_text[46:47] '' --> ' '", + "insert text[26:26] --> decoded_text[48:49] '' --> ' '", + "insert text[27:27] --> decoded_text[50:51] '' --> ' '", + "insert text[28:28] --> decoded_text[52:53] '' --> ' '", + "insert text[29:29] --> decoded_text[54:55] '' --> ' '", + "insert text[30:30] --> decoded_text[56:57] '' --> ' '", + "replace text[31:33] --> decoded_text[58:63] '公司' --> ' 公 司 '", + "insert text[34:34] --> decoded_text[64:65] '' --> ' '", + "insert text[35:35] --> decoded_text[66:67] '' --> ' '", + "insert text[36:36] --> decoded_text[68:69] '' --> ' '", + "insert text[37:37] --> decoded_text[70:71] '' --> ' '", + "insert text[38:38] --> decoded_text[72:73] '' --> ' '", + "insert text[39:39] --> decoded_text[74:75] '' --> ' '", + "insert text[40:40] --> decoded_text[76:77] '' --> ' '", + "insert text[41:41] --> decoded_text[78:79] '' --> ' '", + "insert text[42:42] --> decoded_text[80:81] '' --> ' '", + "insert text[43:43] --> decoded_text[82:83] '' --> ' '", + "insert text[44:44] --> decoded_text[84:85] '' --> ' '", + "insert text[45:45] --> decoded_text[86:87] '' --> ' '", + "insert text[46:46] --> decoded_text[88:89] '' --> ' '", + "insert text[47:47] --> decoded_text[90:91] '' --> ' '", + "insert text[48:48] --> decoded_text[92:93] '' --> ' '", + "insert text[49:49] --> decoded_text[94:95] '' --> ' '", + "replace text[50:51] --> decoded_text[96:99] '的' --> ' 的 '", + "insert text[52:52] --> decoded_text[100:101] '' --> ' '", + "insert text[53:53] --> decoded_text[102:103] '' --> ' '", + "insert text[54:54] --> decoded_text[104:105] '' --> ' '", + "insert text[55:55] --> decoded_text[106:107] '' --> ' '", + "insert text[56:56] --> decoded_text[108:109] '' --> ' '", + "insert text[57:57] --> decoded_text[110:111] '' --> ' '", + "insert text[58:58] --> decoded_text[112:113] '' --> ' '", + "insert text[59:59] --> decoded_text[114:115] '' --> ' '", + "insert text[60:60] --> decoded_text[116:117] '' --> ' '", + "replace text[61:62] --> decoded_text[118:121] '的' --> ' 的 '", + "insert text[63:63] --> decoded_text[122:123] '' --> ' '", + "insert text[64:64] --> decoded_text[124:125] '' --> ' '", + "insert text[65:65] --> decoded_text[126:127] '' --> ' '", + "insert text[66:66] --> decoded_text[128:129] '' --> ' '", + "insert text[67:67] --> decoded_text[130:131] '' --> ' '", + "insert text[68:68] --> decoded_text[132:133] '' --> ' '", + "insert text[69:69] --> decoded_text[134:135] '' --> ' '", + "replace text[70:71] --> decoded_text[136:139] '汽' --> ' 汽 '", + "insert text[72:72] --> decoded_text[140:141] '' --> ' '", + "insert text[73:73] --> decoded_text[142:143] '' --> ' '", + "insert text[74:74] --> decoded_text[144:145] '' --> ' '", + "insert text[75:75] --> decoded_text[146:147] '' --> ' '", + "insert text[76:76] --> decoded_text[148:149] '' --> ' '", + "replace text[77:80] --> decoded_text[150:157] '公司的' --> ' 公 司 的 '", + "replace text[81:82] --> decoded_text[158:161] '总' --> ' 总 '", + "insert text[83:83] --> decoded_text[162:163] '' --> ' '", + "insert text[84:84] --> decoded_text[164:165] '' --> ' '", + "replace text[85:86] --> decoded_text[166:169] '汽' --> ' 汽 '", + "insert text[87:87] --> decoded_text[170:171] '' --> ' '", + "insert text[88:88] --> decoded_text[172:173] '' --> ' '", + "insert text[89:89] --> decoded_text[174:175] '' --> ' '", + "replace text[90:93] --> decoded_text[176:183] '公司的' --> ' 公 司 的 '", + "replace text[94:95] --> decoded_text[184:187] '总' --> ' 总 '", + "insert text[96:96] --> decoded_text[188:189] '' --> ' '", + "insert text[97:97] --> decoded_text[190:191] '' --> ' '", + "insert text[98:98] --> decoded_text[192:193] '' --> ' '", + "insert text[99:99] --> decoded_text[194:195] '' --> ' '", + "replace text[100:101] --> decoded_text[196:199] '汽' --> ' 汽 '", + "insert text[102:102] --> decoded_text[200:201] '' --> ' '", + "insert text[103:103] --> decoded_text[202:203] '' --> ' '", + "replace text[104:108] --> decoded_text[204:213] '公司的总' --> ' 公 司 的 总 '", + "insert text[109:109] --> decoded_text[214:215] '' --> ' '", + "insert text[110:110] --> decoded_text[216:217] '' --> ' '", + "insert text[111:111] --> decoded_text[218:219] '' --> ' '", + "insert text[112:112] --> decoded_text[220:221] '' --> ' '", + "insert text[113:113] --> decoded_text[222:223] '' --> ' '", + "insert text[114:114] --> decoded_text[224:225] '' --> ' '" + ], + "n_oov_chars": 0, + "oov_ratio": 0.0, + "oov_charset": "[]" + }, + { + "text": "大腕导演不可能每部作品都是你喜欢的东西,如果他一时控制不住情绪,就让他骂吧。他也是人,不是神,人就有自己的脾气。他这次执导春晚,对我也开骂:“老毕,我跟你说了这么长时间,让你走2号位,你非要走1号位,你想跟我较死劲是不是?”这也是骂人。但因为你非常了解他,他也不一定有恶意。", + "decoded_text": "大 腕 导 演 不 可 能 每 部 作 品 都 是 你 喜 欢 的 东 西 , 如 果 他 一 时 控 制 不 住 情 绪 , 就 让 他 骂 吧 。 他 也 是 人 , 不 是 神 , 人 就 有 自 己 的 脾 气 。 他 这 次 执 导 春 晚 , 对 我 也 开 骂 : [UNK] 老 毕 , 我 跟 你 说 了 这 么 长 时 间 , 让 你 走 2 号 位 , 你 非 要 走 1 号 位 , 你 想 跟 我 较 死 劲 是 不 是 ? [UNK] 这 也 是 骂 人 。 但 因 为 你 非 常 了 解 他 , 他 也 不 一 定 有 恶 意 。", + "diff": [ + "insert text[1:1] --> decoded_text[1:2] '' --> ' '", + "insert text[2:2] --> decoded_text[3:4] '' --> ' '", + "insert text[3:3] --> decoded_text[5:6] '' --> ' '", + "replace text[4:5] --> decoded_text[7:10] '不' --> ' 不 '", + "insert text[6:6] --> decoded_text[11:12] '' --> ' '", + "insert text[7:7] --> decoded_text[13:14] '' --> ' '", + "insert text[8:8] --> decoded_text[15:16] '' --> ' '", + "insert text[9:9] --> decoded_text[17:18] '' --> ' '", + "insert text[10:10] --> decoded_text[19:20] '' --> ' '", + "insert text[11:11] --> decoded_text[21:22] '' --> ' '", + "replace text[12:14] --> decoded_text[23:28] '是你' --> ' 是 你 '", + "insert text[15:15] --> decoded_text[29:30] '' --> ' '", + "insert text[16:16] --> decoded_text[31:32] '' --> ' '", + "insert text[17:17] --> decoded_text[33:34] '' --> ' '", + "insert text[18:18] --> decoded_text[35:36] '' --> ' '", + "replace text[19:20] --> decoded_text[37:40] ',' --> ' , '", + "insert text[21:21] --> decoded_text[41:42] '' --> ' '", + "replace text[22:23] --> decoded_text[43:46] '他' --> ' 他 '", + "insert text[24:24] --> decoded_text[47:48] '' --> ' '", + "insert text[25:25] --> decoded_text[49:50] '' --> ' '", + "insert text[26:26] --> decoded_text[51:52] '' --> ' '", + "replace text[27:28] --> decoded_text[53:56] '不' --> ' 不 '", + "insert text[29:29] --> decoded_text[57:58] '' --> ' '", + "insert text[30:30] --> decoded_text[59:60] '' --> ' '", + "replace text[31:32] --> decoded_text[61:64] ',' --> ' , '", + "insert text[33:33] --> decoded_text[65:66] '' --> ' '", + "replace text[34:35] --> decoded_text[67:70] '他' --> ' 他 '", + "insert text[36:36] --> decoded_text[71:72] '' --> ' '", + "replace text[37:41] --> decoded_text[73:82] '。他也是' --> ' 。 他 也 是 '", + "replace text[42:45] --> decoded_text[83:90] ',不是' --> ' , 不 是 '", + "replace text[46:47] --> decoded_text[91:94] ',' --> ' , '", + "insert text[48:48] --> decoded_text[95:96] '' --> ' '", + "insert text[49:49] --> decoded_text[97:98] '' --> ' '", + "insert text[50:50] --> decoded_text[99:100] '' --> ' '", + "insert text[51:51] --> decoded_text[101:102] '' --> ' '", + "insert text[52:52] --> decoded_text[103:104] '' --> ' '", + "insert text[53:53] --> decoded_text[105:106] '' --> ' '", + "insert text[54:54] --> decoded_text[107:108] '' --> ' '", + "replace text[55:57] --> decoded_text[109:114] '。他' --> ' 。 他 '", + "insert text[58:58] --> decoded_text[115:116] '' --> ' '", + "insert text[59:59] --> decoded_text[117:118] '' --> ' '", + "insert text[60:60] --> decoded_text[119:120] '' --> ' '", + "insert text[61:61] --> decoded_text[121:122] '' --> ' '", + "insert text[62:62] --> decoded_text[123:124] '' --> ' '", + "replace text[63:64] --> decoded_text[125:128] ',' --> ' , '", + "insert text[65:65] --> decoded_text[129:130] '' --> ' '", + "replace text[66:67] --> decoded_text[131:134] '也' --> ' 也 '", + "insert text[68:68] --> decoded_text[135:136] '' --> ' '", + "insert text[69:69] --> decoded_text[137:138] '' --> ' '", + "replace text[70:71] --> decoded_text[139:146] '“' --> ' [UNK] '", + "insert text[72:72] --> decoded_text[147:148] '' --> ' '", + "replace text[73:74] --> decoded_text[149:152] ',' --> ' , '", + "insert text[75:75] --> decoded_text[153:154] '' --> ' '", + "replace text[76:77] --> decoded_text[155:158] '你' --> ' 你 '", + "insert text[78:78] --> decoded_text[159:160] '' --> ' '", + "insert text[79:79] --> decoded_text[161:162] '' --> ' '", + "insert text[80:80] --> decoded_text[163:164] '' --> ' '", + "insert text[81:81] --> decoded_text[165:166] '' --> ' '", + "insert text[82:82] --> decoded_text[167:168] '' --> ' '", + "insert text[83:83] --> decoded_text[169:170] '' --> ' '", + "replace text[84:85] --> decoded_text[171:174] ',' --> ' , '", + "replace text[86:87] --> decoded_text[175:178] '你' --> ' 你 '", + "insert text[88:88] --> decoded_text[179:180] '' --> ' '", + "insert text[89:89] --> decoded_text[181:182] '' --> ' '", + "insert text[90:90] --> decoded_text[183:184] '' --> ' '", + "replace text[91:93] --> decoded_text[185:190] ',你' --> ' , 你 '", + "insert text[94:94] --> decoded_text[191:192] '' --> ' '", + "insert text[95:95] --> decoded_text[193:194] '' --> ' '", + "insert text[96:96] --> decoded_text[195:196] '' --> ' '", + "insert text[97:97] --> decoded_text[197:198] '' --> ' '", + "insert text[98:98] --> decoded_text[199:200] '' --> ' '", + "replace text[99:101] --> decoded_text[201:206] ',你' --> ' , 你 '", + "insert text[102:102] --> decoded_text[207:208] '' --> ' '", + "insert text[103:103] --> decoded_text[209:210] '' --> ' '", + "insert text[104:104] --> decoded_text[211:212] '' --> ' '", + "insert text[105:105] --> decoded_text[213:214] '' --> ' '", + "insert text[106:106] --> decoded_text[215:216] '' --> ' '", + "replace text[107:110] --> decoded_text[217:224] '是不是' --> ' 是 不 是 '", + "replace text[111:112] --> decoded_text[225:232] '”' --> ' [UNK] '", + "replace text[113:115] --> decoded_text[233:238] '也是' --> ' 也 是 '", + "insert text[116:116] --> decoded_text[239:240] '' --> ' '", + "replace text[117:118] --> decoded_text[241:244] '。' --> ' 。 '", + "insert text[119:119] --> decoded_text[245:246] '' --> ' '", + "insert text[120:120] --> decoded_text[247:248] '' --> ' '", + "replace text[121:122] --> decoded_text[249:252] '你' --> ' 你 '", + "insert text[123:123] --> decoded_text[253:254] '' --> ' '", + "insert text[124:124] --> decoded_text[255:256] '' --> ' '", + "insert text[125:125] --> decoded_text[257:258] '' --> ' '", + "replace text[126:131] --> decoded_text[259:270] '他,他也不' --> ' 他 , 他 也 不 '", + "insert text[132:132] --> decoded_text[271:272] '' --> ' '", + "insert text[133:133] --> decoded_text[273:274] '' --> ' '", + "insert text[134:134] --> decoded_text[275:276] '' --> ' '", + "insert text[135:135] --> decoded_text[277:278] '' --> ' '", + "replace text[136:137] --> decoded_text[279:281] '。' --> ' 。'" + ], + "n_oov_chars": 2, + "oov_ratio": 0.014598540145985401, + "oov_charset": "[\"“\", \"”\"]" + }, + { + "text": "招财带什么佛牌不过挣得多,娜姐也花得多。有媒体报道,教练卡洛斯的年薪高达360万元人民币,李娜每年的花费是600多万元。用一个形象的比喻,娜姐每天一睁眼,将近2万元就出去了。", + "decoded_text": "招 财 带 什 么 佛 牌 不 过 挣 得 多 , 娜 姐 也 花 得 多 。 有 媒 体 报 道 , 教 练 卡 洛 斯 的 年 薪 高 达 360 万 元 人 民 币 , 李 娜 每 年 的 花 费 是 600 多 万 元 。 用 一 个 形 象 的 比 喻 , 娜 姐 每 天 一 睁 眼 , 将 近 2 万 元 就 出 去 了 。", + "diff": [ + "insert text[1:1] --> decoded_text[1:2] '' --> ' '", + "insert text[2:2] --> decoded_text[3:4] '' --> ' '", + "insert text[3:3] --> decoded_text[5:6] '' --> ' '", + "insert text[4:4] --> decoded_text[7:8] '' --> ' '", + "insert text[5:5] --> decoded_text[9:10] '' --> ' '", + "insert text[6:6] --> decoded_text[11:12] '' --> ' '", + "insert text[7:7] --> decoded_text[13:14] '' --> ' '", + "insert text[8:8] --> decoded_text[15:16] '' --> ' '", + "insert text[9:9] --> decoded_text[17:18] '' --> ' '", + "insert text[10:10] --> decoded_text[19:20] '' --> ' '", + "insert text[11:11] --> decoded_text[21:22] '' --> ' '", + "insert text[12:12] --> decoded_text[23:24] '' --> ' '", + "insert text[13:13] --> decoded_text[25:26] '' --> ' '", + "insert text[14:14] --> decoded_text[27:28] '' --> ' '", + "insert text[15:15] --> decoded_text[29:30] '' --> ' '", + "insert text[16:16] --> decoded_text[31:32] '' --> ' '", + "insert text[17:17] --> decoded_text[33:34] '' --> ' '", + "insert text[18:18] --> decoded_text[35:36] '' --> ' '", + "insert text[19:19] --> decoded_text[37:38] '' --> ' '", + "insert text[20:20] --> decoded_text[39:40] '' --> ' '", + "insert text[21:21] --> decoded_text[41:42] '' --> ' '", + "insert text[22:22] --> decoded_text[43:44] '' --> ' '", + "insert text[23:23] --> decoded_text[45:46] '' --> ' '", + "insert text[24:24] --> decoded_text[47:48] '' --> ' '", + "insert text[25:25] --> decoded_text[49:50] '' --> ' '", + "insert text[26:26] --> decoded_text[51:52] '' --> ' '", + "insert text[27:27] --> decoded_text[53:54] '' --> ' '", + "insert text[28:28] --> decoded_text[55:56] '' --> ' '", + "insert text[29:29] --> decoded_text[57:58] '' --> ' '", + "insert text[30:30] --> decoded_text[59:60] '' --> ' '", + "insert text[31:31] --> decoded_text[61:62] '' --> ' '", + "insert text[32:32] --> decoded_text[63:64] '' --> ' '", + "insert text[33:33] --> decoded_text[65:66] '' --> ' '", + "insert text[34:34] --> decoded_text[67:68] '' --> ' '", + "insert text[35:35] --> decoded_text[69:70] '' --> ' '", + "insert text[36:36] --> decoded_text[71:72] '' --> ' '", + "insert text[39:39] --> decoded_text[75:76] '' --> ' '", + "insert text[40:40] --> decoded_text[77:78] '' --> ' '", + "insert text[41:41] --> decoded_text[79:80] '' --> ' '", + "insert text[42:42] --> decoded_text[81:82] '' --> ' '", + "insert text[43:43] --> decoded_text[83:84] '' --> ' '", + "insert text[44:44] --> decoded_text[85:86] '' --> ' '", + "insert text[45:45] --> decoded_text[87:88] '' --> ' '", + "insert text[46:46] --> decoded_text[89:90] '' --> ' '", + "insert text[47:47] --> decoded_text[91:92] '' --> ' '", + "insert text[48:48] --> decoded_text[93:94] '' --> ' '", + "insert text[49:49] --> decoded_text[95:96] '' --> ' '", + "insert text[50:50] --> decoded_text[97:98] '' --> ' '", + "insert text[51:51] --> decoded_text[99:100] '' --> ' '", + "insert text[52:52] --> decoded_text[101:102] '' --> ' '", + "insert text[53:53] --> decoded_text[103:104] '' --> ' '", + "insert text[56:56] --> decoded_text[107:108] '' --> ' '", + "insert text[57:57] --> decoded_text[109:110] '' --> ' '", + "insert text[58:58] --> decoded_text[111:112] '' --> ' '", + "insert text[59:59] --> decoded_text[113:114] '' --> ' '", + "insert text[60:60] --> decoded_text[115:116] '' --> ' '", + "insert text[61:61] --> decoded_text[117:118] '' --> ' '", + "insert text[62:62] --> decoded_text[119:120] '' --> ' '", + "insert text[63:63] --> decoded_text[121:122] '' --> ' '", + "insert text[64:64] --> decoded_text[123:124] '' --> ' '", + "insert text[65:65] --> decoded_text[125:126] '' --> ' '", + "insert text[66:66] --> decoded_text[127:128] '' --> ' '", + "insert text[67:67] --> decoded_text[129:130] '' --> ' '", + "insert text[68:68] --> decoded_text[131:132] '' --> ' '", + "insert text[69:69] --> decoded_text[133:134] '' --> ' '", + "insert text[70:70] --> decoded_text[135:136] '' --> ' '", + "insert text[71:71] --> decoded_text[137:138] '' --> ' '", + "insert text[72:72] --> decoded_text[139:140] '' --> ' '", + "insert text[73:73] --> decoded_text[141:142] '' --> ' '", + "insert text[74:74] --> decoded_text[143:144] '' --> ' '", + "insert text[75:75] --> decoded_text[145:146] '' --> ' '", + "insert text[76:76] --> decoded_text[147:148] '' --> ' '", + "insert text[77:77] --> decoded_text[149:150] '' --> ' '", + "insert text[78:78] --> decoded_text[151:152] '' --> ' '", + "insert text[79:79] --> decoded_text[153:154] '' --> ' '", + "insert text[80:80] --> decoded_text[155:156] '' --> ' '", + "insert text[81:81] --> decoded_text[157:158] '' --> ' '", + "insert text[82:82] --> decoded_text[159:160] '' --> ' '", + "insert text[83:83] --> decoded_text[161:162] '' --> ' '", + "insert text[84:84] --> decoded_text[163:164] '' --> ' '", + "insert text[85:85] --> decoded_text[165:166] '' --> ' '", + "insert text[86:86] --> decoded_text[167:168] '' --> ' '" + ], + "n_oov_chars": 0, + "oov_ratio": 0.0, + "oov_charset": "[]" + }, + { + "text": "“金庸的小说《连城诀》里有一个反派人物‘血刀老祖’,一般的坏人做坏事都是心虚的,但是这个人物却做得心安理得,理直气壮,我遇到的这个的哥就是这样。”王先生向记者描述经过时第一句话便这样说。原来,昨日王先生在搭出租车时,遇到的的哥不仅“拾金而昧”,还“昧”得理直气壮。", + "decoded_text": "[UNK] 金 庸 的 小 说 《 连 城 诀 》 里 有 一 个 反 派 人 物 [UNK] 血 刀 老 祖 [UNK] , 一 般 的 坏 人 做 坏 事 都 是 心 虚 的 , 但 是 这 个 人 物 却 做 得 心 安 理 得 , 理 直 气 壮 , 我 遇 到 的 这 个 的 哥 就 是 这 样 。 [UNK] 王 先 生 向 记 者 描 述 经 过 时 第 一 句 话 便 这 样 说 。 原 来 , 昨 日 王 先 生 在 搭 出 租 车 时 , 遇 到 的 的 哥 不 仅 [UNK] 拾 金 而 昧 [UNK] , 还 [UNK] 昧 [UNK] 得 理 直 气 壮 。", + "diff": [ + "replace text[0:1] --> decoded_text[0:6] '“' --> '[UNK] '", + "insert text[2:2] --> decoded_text[7:8] '' --> ' '", + "replace text[3:4] --> decoded_text[9:12] '的' --> ' 的 '", + "insert text[5:5] --> decoded_text[13:14] '' --> ' '", + "insert text[6:6] --> decoded_text[15:16] '' --> ' '", + "insert text[7:7] --> decoded_text[17:18] '' --> ' '", + "insert text[8:8] --> decoded_text[19:20] '' --> ' '", + "insert text[9:9] --> decoded_text[21:22] '' --> ' '", + "insert text[10:10] --> decoded_text[23:24] '' --> ' '", + "insert text[11:11] --> decoded_text[25:26] '' --> ' '", + "insert text[12:12] --> decoded_text[27:28] '' --> ' '", + "insert text[13:13] --> decoded_text[29:30] '' --> ' '", + "insert text[14:14] --> decoded_text[31:32] '' --> ' '", + "insert text[15:15] --> decoded_text[33:34] '' --> ' '", + "insert text[16:16] --> decoded_text[35:36] '' --> ' '", + "insert text[17:17] --> decoded_text[37:38] '' --> ' '", + "insert text[18:18] --> decoded_text[39:40] '' --> ' '", + "replace text[19:20] --> decoded_text[41:48] '‘' --> ' [UNK] '", + "insert text[21:21] --> decoded_text[49:50] '' --> ' '", + "insert text[22:22] --> decoded_text[51:52] '' --> ' '", + "insert text[23:23] --> decoded_text[53:54] '' --> ' '", + "replace text[24:26] --> decoded_text[55:64] '’,' --> ' [UNK] , '", + "insert text[27:27] --> decoded_text[65:66] '' --> ' '", + "replace text[28:29] --> decoded_text[67:70] '的' --> ' 的 '", + "insert text[30:30] --> decoded_text[71:72] '' --> ' '", + "insert text[31:31] --> decoded_text[73:74] '' --> ' '", + "insert text[32:32] --> decoded_text[75:76] '' --> ' '", + "insert text[33:33] --> decoded_text[77:78] '' --> ' '", + "insert text[34:34] --> decoded_text[79:80] '' --> ' '", + "insert text[35:35] --> decoded_text[81:82] '' --> ' '", + "insert text[36:36] --> decoded_text[83:84] '' --> ' '", + "insert text[37:37] --> decoded_text[85:86] '' --> ' '", + "replace text[38:40] --> decoded_text[87:92] '的,' --> ' 的 , '", + "insert text[41:41] --> decoded_text[93:94] '' --> ' '", + "replace text[42:43] --> decoded_text[95:98] '这' --> ' 这 '", + "insert text[44:44] --> decoded_text[99:100] '' --> ' '", + "insert text[45:45] --> decoded_text[101:102] '' --> ' '", + "insert text[46:46] --> decoded_text[103:104] '' --> ' '", + "insert text[47:47] --> decoded_text[105:106] '' --> ' '", + "insert text[48:48] --> decoded_text[107:108] '' --> ' '", + "insert text[49:49] --> decoded_text[109:110] '' --> ' '", + "insert text[50:50] --> decoded_text[111:112] '' --> ' '", + "insert text[51:51] --> decoded_text[113:114] '' --> ' '", + "insert text[52:52] --> decoded_text[115:116] '' --> ' '", + "replace text[53:54] --> decoded_text[117:120] ',' --> ' , '", + "insert text[55:55] --> decoded_text[121:122] '' --> ' '", + "insert text[56:56] --> decoded_text[123:124] '' --> ' '", + "insert text[57:57] --> decoded_text[125:126] '' --> ' '", + "replace text[58:59] --> decoded_text[127:130] ',' --> ' , '", + "insert text[60:60] --> decoded_text[131:132] '' --> ' '", + "insert text[61:61] --> decoded_text[133:134] '' --> ' '", + "replace text[62:64] --> decoded_text[135:140] '的这' --> ' 的 这 '", + "replace text[65:66] --> decoded_text[141:144] '的' --> ' 的 '", + "insert text[67:67] --> decoded_text[145:146] '' --> ' '", + "insert text[68:68] --> decoded_text[147:148] '' --> ' '", + "replace text[69:70] --> decoded_text[149:152] '这' --> ' 这 '", + "insert text[71:71] --> decoded_text[153:154] '' --> ' '", + "replace text[72:73] --> decoded_text[155:162] '”' --> ' [UNK] '", + "insert text[74:74] --> decoded_text[163:164] '' --> ' '", + "insert text[75:75] --> decoded_text[165:166] '' --> ' '", + "insert text[76:76] --> decoded_text[167:168] '' --> ' '", + "insert text[77:77] --> decoded_text[169:170] '' --> ' '", + "insert text[78:78] --> decoded_text[171:172] '' --> ' '", + "insert text[79:79] --> decoded_text[173:174] '' --> ' '", + "insert text[80:80] --> decoded_text[175:176] '' --> ' '", + "insert text[81:81] --> decoded_text[177:178] '' --> ' '", + "insert text[82:82] --> decoded_text[179:180] '' --> ' '", + "insert text[83:83] --> decoded_text[181:182] '' --> ' '", + "insert text[84:84] --> decoded_text[183:184] '' --> ' '", + "insert text[85:85] --> decoded_text[185:186] '' --> ' '", + "insert text[86:86] --> decoded_text[187:188] '' --> ' '", + "insert text[87:87] --> decoded_text[189:190] '' --> ' '", + "insert text[88:88] --> decoded_text[191:192] '' --> ' '", + "replace text[89:90] --> decoded_text[193:196] '这' --> ' 这 '", + "insert text[91:91] --> decoded_text[197:198] '' --> ' '", + "insert text[92:92] --> decoded_text[199:200] '' --> ' '", + "insert text[93:93] --> decoded_text[201:202] '' --> ' '", + "insert text[94:94] --> decoded_text[203:204] '' --> ' '", + "replace text[95:96] --> decoded_text[205:208] ',' --> ' , '", + "insert text[97:97] --> decoded_text[209:210] '' --> ' '", + "insert text[98:98] --> decoded_text[211:212] '' --> ' '", + "insert text[99:99] --> decoded_text[213:214] '' --> ' '", + "insert text[100:100] --> decoded_text[215:216] '' --> ' '", + "insert text[101:101] --> decoded_text[217:218] '' --> ' '", + "insert text[102:102] --> decoded_text[219:220] '' --> ' '", + "insert text[103:103] --> decoded_text[221:222] '' --> ' '", + "insert text[104:104] --> decoded_text[223:224] '' --> ' '", + "insert text[105:105] --> decoded_text[225:226] '' --> ' '", + "insert text[106:106] --> decoded_text[227:228] '' --> ' '", + "replace text[107:108] --> decoded_text[229:232] ',' --> ' , '", + "insert text[109:109] --> decoded_text[233:234] '' --> ' '", + "replace text[110:112] --> decoded_text[235:240] '的的' --> ' 的 的 '", + "insert text[113:113] --> decoded_text[241:242] '' --> ' '", + "insert text[114:114] --> decoded_text[243:244] '' --> ' '", + "replace text[115:116] --> decoded_text[245:252] '“' --> ' [UNK] '", + "insert text[117:117] --> decoded_text[253:254] '' --> ' '", + "insert text[118:118] --> decoded_text[255:256] '' --> ' '", + "insert text[119:119] --> decoded_text[257:258] '' --> ' '", + "replace text[120:122] --> decoded_text[259:268] '”,' --> ' [UNK] , '", + "replace text[123:124] --> decoded_text[269:276] '“' --> ' [UNK] '", + "replace text[125:126] --> decoded_text[277:284] '”' --> ' [UNK] '", + "insert text[127:127] --> decoded_text[285:286] '' --> ' '", + "insert text[128:128] --> decoded_text[287:288] '' --> ' '", + "insert text[129:129] --> decoded_text[289:290] '' --> ' '", + "insert text[130:130] --> decoded_text[291:292] '' --> ' '", + "insert text[131:131] --> decoded_text[293:294] '' --> ' '" + ], + "n_oov_chars": 8, + "oov_ratio": 0.06060606060606061, + "oov_charset": "[\"“\", \"‘\", \"’\", \"”\"]" + } ] \ No newline at end of file