neavo
/

modern_bert_multilingual

Model card Files Files and versions

neavo commited on Jan 31

Commit

6cfea74

·

verified ·

1 Parent(s): 437c78f

Update README.md

Files changed (1) hide show

README.md +7 -4

README.md CHANGED Viewed

@@ -5,6 +5,7 @@ language:
 - ja
 - ko
 pipeline_tag: fill-mask
 ---
 ### Overview
@@ -39,8 +40,10 @@ pipeline_tag: fill-mask
 - Training script available on [Github](https://github.com/neavo/KeywordGachaModel).
 ### 综述
-- ModernBertMultilingual 是一个从零开始训练的多语言模型，使用 [ModernBERT-base](https://huggingface.co/answerdotai/ModernBERT-base) 架构
-- 支持 `简体中文`、`繁体中文`、`英文`、`日文`、`韩文` 等四种语言及其变种，可以很好处理东亚语言混合文本任务
 ### 技术指标
 - 在 `L40*7` 的设备上训练了大约 `100` 个小时，训练量大约 `60B` Token
@@ -55,9 +58,9 @@ pipeline_tag: fill-mask
 ### 发布版本
 - 提供 3 个不同的权重版本
-  - base - 使用通用基础预料进行完整训练的版本，可以较好的适用于各种不同领域文本（默认）
   - nodecay - 退火阶段开始前的检查点，你可以在这个权重的基础上添加领域语料进行退火以使其更适应目标领域
-  - keyword_gacha_multilingual - 使用 ACGN（例如 `轻小说`、`游戏脚本`、`漫画脚本`等）类型文本进行退火的版本
 | 模型 | 版本 | 说明 |
 | :--: | :--: | :--:|

 - ja
 - ko
 pipeline_tag: fill-mask
+license: apache-2.0
 ---
 ### Overview
 - Training script available on [Github](https://github.com/neavo/KeywordGachaModel).
 ### 综述
+- ModernBertMultilingual 是一个从零开始训练的多语言模型
+- 使用 [ModernBERT-base](https://huggingface.co/answerdotai/ModernBERT-base) 架构
+- 支持 `简体中文`、`繁体中文`、`英文`、`日文`、`韩文` 等四种语言及其变种
+- 可以很好处理东亚语言混合文本任务
 ### 技术指标
 - 在 `L40*7` 的设备上训练了大约 `100` 个小时，训练量大约 `60B` Token
 ### 发布版本
 - 提供 3 个不同的权重版本
+  - base - 使用通用预料完整训练，可以较好的适用于各种不同领域文本
   - nodecay - 退火阶段开始前的检查点，你可以在这个权重的基础上添加领域语料进行退火以使其更适应目标领域
+  - keyword_gacha_multilingual - 使用 ACGN（例如 `轻小说`、`游戏脚本`、`漫画脚本` 等）类型文本进行退火的版本
 | 模型 | 版本 | 说明 |
 | :--: | :--: | :--:|