opencsg
/

opencsg-CodeLlama-7b-v0.1

@@ -129,14 +129,8 @@ for seq in sequences:
 - **BP16 if applicable:** [apex](https://github.com/NVIDIA/apex)
-<a id="chinese"></a>
-<p align="center">
-<img width="300px" alt="OpenCSG" src="https://cdn-uploads.huggingface.co/production/uploads/64c71b27d43e4dee51a8b31a/GwYXPKuEoGCGcMICeW-sb.jpeg">
-</p>
-<p align="center"><a href="https://portal.opencsg.com/models">[OpenCSG Community]</a>   <a href="https://github.com/opencsgs">[github]</a>  <a href="https://cdn-uploads.huggingface.co/production/uploads/64c71b27d43e4dee51a8b31a/HU6vz21qKTEmUBCWqCFh9.jpeg">[wechat]</a>  <a href="https://twitter.com/OpenCsg">[Twitter]</a> </p>
 </div>
 OpenCSG 致力于资源融合、软件求精和生成式 LM。其中，“C”代表资源融合（Converged resources），表示多种混合资源的整合和充分利用。 “S”代表软件求精（Software refinement），表示通过大模型精炼过的软件。 “G”代表生成型语言模型（Generative LM），它表示广泛使用的、包容性的、经过民主化的生成式大模型。
@@ -148,11 +142,11 @@ OpenCSG 的愿景是让每个行业、每个公司、每个人都拥有自己的
 ## 模型介绍
-CodeLlama 是一系列由 Llama2 经过预训练和微调得到的生成式文本大模型，其规模从 70 亿到 340 亿个参数不等。
 opencsg-CodeLlama-v0.1是一系列基于CodeLlama的通过全参数微调方法进行调优的模型。
 <br>
-这是基于[CodeLlama-7b-hf](https://huggingface.co/codellama/CodeLlama-7b-hf)进行微调的 7B 基座版本的仓库。
 | 模型大小    | 基座模型                                                                    |
 | --- | ----------------------------------------------------------------------------- |
@@ -164,13 +158,13 @@ opencsg-CodeLlama-v0.1是一系列基于CodeLlama的通过全参数微调方法
 ## 模型评估
 HumanEval 是评估模型在代码生成方面性能的最常见的基准，尤其是在代码习题的补全方面。
-模型评估在某种程度上是一种形而上学。不同的模型对解码方法、参数和指令的敏感度不同。
-为每个微调模型手动设置配置是不切实际的，因为尽管参数是用户设置的，但是真正的大模型应该掌握通用能力。
 因此，OpenCSG 提供了一个相对公平的方法来在 HumanEval 基准上比较各微调模型。
-为了简化比较，我们选择了Python语言Pass@1指标，但要注意的是，我们的微调数据集包含多种编程语言。
-**为了公平起见，我们仅根据原始案例的提示来评估原始和微调过的 CodeLlama 模型，不包含任何其他说明。**
 **除此之外，我们在评估过程中对每个模型都使用贪婪解码方法。**
@@ -184,7 +178,7 @@ HumanEval 是评估模型在代码生成方面性能的最常见的基准，尤
 | opencsg-CodeLlama-34b-v0.1(4k)| **48.8%** |
 **TODO**
-- 未来我们将提供更多微调模型的在各基准上获得的分数。
 - 我们将提供不同的实际问题来评估微调模型在软件工程领域的性能。
@@ -236,12 +230,12 @@ for seq in sequences:
 ## 硬件资源
-- **GPUs：** 8 Tesla A800
 - **训练时间：** 4 小时
 ## 软件使用
-- **组织：** [Deepspeed](https://github.com/OpenCSGs)
-- **神经网络：** [PyTorch](https://github.com/pytorch/pytorch)
-- **半精度浮点数BP16（如果适用）：** [apex](https://github.com/NVIDIA/apex)

 - **BP16 if applicable:** [apex](https://github.com/NVIDIA/apex)
+<a id="chinese"></a>
 </div>
 OpenCSG 致力于资源融合、软件求精和生成式 LM。其中，“C”代表资源融合（Converged resources），表示多种混合资源的整合和充分利用。 “S”代表软件求精（Software refinement），表示通过大模型精炼过的软件。 “G”代表生成型语言模型（Generative LM），它表示广泛使用的、包容性的、经过民主化的生成式大模型。
 ## 模型介绍
+CodeLlama 是一系列由 Llama2 经过预训练和微调得到的生成式代码大模型，其规模从 70 亿到 340 亿个参数不等。
 opencsg-CodeLlama-v0.1是一系列基于CodeLlama的通过全参数微调方法进行调优的模型。
 <br>
+这是基于[CodeLlama-7b-hf](https://huggingface.co/codellama/CodeLlama-7b-hf)进行微调的模型版本。
 | 模型大小    | 基座模型                                                                    |
 | --- | ----------------------------------------------------------------------------- |
 ## 模型评估
 HumanEval 是评估模型在代码生成方面性能的最常见的基准，尤其是在代码习题的补全方面。
+模型评估在某种程度上是一种玄学。不同的模型对解码方法、参数和指令的敏感度不同，
+优秀的大模型是具备通用能力的，而不会因为解码参数的调整使得模型的生成表现有很大的差异。
 因此，OpenCSG 提供了一个相对公平的方法来在 HumanEval 基准上比较各微调模型。
+方便起见，我们选择了Python语言Pass@1指标，但要注意的是，我们的微调数据集是包含多种编程语言。
+**为了公平起见，我们仅根据原始问题的提示来评估原始和微调过的 CodeLlama 模型，不包含任何其他说明。**
 **除此之外，我们在评估过程中对每个模型都使用贪婪解码方法。**
 | opencsg-CodeLlama-34b-v0.1(4k)| **48.8%** |
 **TODO**
+- 未来我们将提供更多微调模型的在各基准上的分数。
 - 我们将提供不同的实际问题来评估微调模型在软件工程领域的性能。
 ## 硬件资源
+- **GPU数量：** 8 Tesla A800
 - **训练时间：** 4 小时
 ## 软件使用
+- **微调训练框架：** [Deepspeed](https://github.com/OpenCSGs)
+- **深度学习框架：** [PyTorch](https://github.com/pytorch/pytorch)
+- **BP16：** [apex](https://github.com/NVIDIA/apex)