Update README.md
Browse files
README.md
CHANGED
@@ -184,8 +184,8 @@ HumanEval 是评估模型在代码生成方面性能的最常见的基准,尤
|
|
184 |
| opencsg-CodeLlama-34b-v0.1(4k)| **48.8%** |
|
185 |
|
186 |
**TODO**
|
187 |
-
-
|
188 |
-
-
|
189 |
|
190 |
|
191 |
|
|
|
184 |
| opencsg-CodeLlama-34b-v0.1(4k)| **48.8%** |
|
185 |
|
186 |
**TODO**
|
187 |
+
- 未来我们将提供更多微调模型的在各基准上获得的分数。
|
188 |
+
- 我们将提供不同的实际问题来评估微调模型在软件工程领域的性能。
|
189 |
|
190 |
|
191 |
|