tclf90
commited on
Commit
·
94dc9d8
1
Parent(s):
f0eb1f5
Update README.md
Browse files
README.md
CHANGED
@@ -21,9 +21,12 @@ tags:
|
|
21 |
### 【模型大小】
|
22 |
`6.2GB`
|
23 |
|
24 |
-
###
|
|
|
|
|
|
|
25 |
|
26 |
-
|
27 |
|
28 |
GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。 在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。 除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。 本代模型增加了多语言支持,支持包括日语,韩语,德语在内的 26 种语言。我们还推出了支持 1M 上下文长度(约 200 万中文字符)的模型。
|
29 |
|
|
|
21 |
### 【模型大小】
|
22 |
`6.2GB`
|
23 |
|
24 |
+
### 【临时情况告知】
|
25 |
+
|
26 |
+
1. 目前需要用vllm entrypoint的方式来启动模型。
|
27 |
+
2. 如果首次对话出现感叹号,那么添加一些提示词可以规避,近期会跟进寻找修复策略。
|
28 |
|
29 |
+
### 【介绍】
|
30 |
|
31 |
GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。 在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。 除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。 本代模型增加了多语言支持,支持包括日语,韩语,德语在内的 26 种语言。我们还推出了支持 1M 上下文长度(约 200 万中文字符)的模型。
|
32 |
|