tclf90 commited on
Commit
94dc9d8
·
1 Parent(s): f0eb1f5

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +5 -2
README.md CHANGED
@@ -21,9 +21,12 @@ tags:
21
  ### 【模型大小】
22
  `6.2GB`
23
 
24
- ### 【介绍】
 
 
 
25
 
26
- <i>似乎需要确保flash attention的安装</i>
27
 
28
  GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。 在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。 除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。 本代模型增加了多语言支持,支持包括日语,韩语,德语在内的 26 种语言。我们还推出了支持 1M 上下文长度(约 200 万中文字符)的模型。
29
 
 
21
  ### 【模型大小】
22
  `6.2GB`
23
 
24
+ ### 【临时情况告知】
25
+
26
+ 1. 目前需要用vllm entrypoint的方式来启动模型。
27
+ 2. 如果首次对话出现感叹号,那么添加一些提示词可以规避,近期会跟进寻找修复策略。
28
 
29
+ ### 【介绍】
30
 
31
  GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。 在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。 除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。 本代模型增加了多语言支持,支持包括日语,韩语,德语在内的 26 种语言。我们还推出了支持 1M 上下文长度(约 200 万中文字符)的模型。
32