ValueFX9507 commited on
Commit
1266b95
·
verified ·
1 Parent(s): 2bb6546

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +27 -11
README.md CHANGED
@@ -19,7 +19,10 @@ license: other
19
  - **GGUF**: [Q4_K_M | Q5_K_M | Q8_0](https://huggingface.co/ValueFX9507/Tifa-Deepsex-14b-CoT)(更多量化版本持续更新中)
20
  - **Demo APK**: [点击下载](https://example.com/path/to/demo.apk) <!-- 替换为实际下载链接 -->
21
 
22
- 本模型基于Deepseek-R1-14B进行深度优化,通过三重训练策略显著增强小说文本生成与思维链(CoT)能力。特别适合需要长程上下文关联的创作场景。
 
 
 
23
 
24
  ## 模型亮点
25
  🔥 **四阶段进化架构**:
@@ -40,7 +43,7 @@ license: other
40
  | 基础架构 | Deepseek-R1-14B |
41
  | 最大上下文 | 128k |
42
  | 训练数据 | 0.4T小说 + 10万条SFT + Deepseek混合数据 |
43
- | 训练设备 | 8×H800 GPU集群 |
44
  | 量化支持 | GGUF(全系列量化计划中) |
45
 
46
  ## 使用场景
@@ -61,17 +64,30 @@ license: other
61
  2. 角色扮演数据需遵循[Tifa使用协议](https://leftnorth.com/terms.html)
62
  3. 生成内容需符合当地法律法规
63
 
64
- ## 示例对话
65
- ```python
66
- from transformers import AutoTokenizer, AutoModelForCausalLM
67
 
68
- model = AutoModelForCausalLM.from_pretrained("your_hf_account/Tifa-Deepseek-14b-CoT")
69
- tokenizer = AutoTokenizer.from_pretrained("your_hf_account/Tifa-Deepseek-14b-CoT")
 
 
 
 
 
 
 
 
 
 
 
70
 
71
- input_text = "[系统]进入创作模式...</s>[作者]现在要描写一个未来都市的雨夜场景:"
72
- inputs = tokenizer(input_text, return_tensors="pt")
73
- outputs = model.generate(**inputs, max_length=1024)
74
- print(tokenizer.decode(outputs[0]))
 
 
 
 
 
75
  ```
76
 
77
  ## 致谢
 
19
  - **GGUF**: [Q4_K_M | Q5_K_M | Q8_0](https://huggingface.co/ValueFX9507/Tifa-Deepsex-14b-CoT)(更多量化版本持续更新中)
20
  - **Demo APK**: [点击下载](https://example.com/path/to/demo.apk) <!-- 替换为实际下载链接 -->
21
 
22
+ 本模型基于Deepseek-R1-14B进行深度优化,通过三重训练策略显著增强角色扮演、小说文本生成与思维链(CoT)能力。特别适合需要长程上下文关联的创作场景。
23
+
24
+ ## 目标
25
+ 针对原版Deepseek-R1-14B在长文本生成连贯性不足和角色扮演能力薄弱的核心缺陷(主要由于训练数据中小说类语料占比过低),本模型通过多阶段优化提升其角色扮演能力。
26
 
27
  ## 模型亮点
28
  🔥 **四阶段进化架构**:
 
43
  | 基础架构 | Deepseek-R1-14B |
44
  | 最大上下文 | 128k |
45
  | 训练数据 | 0.4T小说 + 10万条SFT + Deepseek混合数据 |
46
+ | 训练设备 | 8×H20 GPU集群 |
47
  | 量化支持 | GGUF(全系列量化计划中) |
48
 
49
  ## 使用场景
 
64
  2. 角色扮演数据需遵循[Tifa使用协议](https://leftnorth.com/terms.html)
65
  3. 生成内容需符合当地法律法规
66
 
 
 
 
67
 
68
+ ## 💡 使用建议
69
+ **最佳实践**:
70
+ ```python
71
+ # 启用角色扮演模式
72
+ prompt = """<system>进入Tifa角色引擎...</system>
73
+ <user>你现在是流浪武士楚夜,正站在长安城屋顶上</user>
74
+ <think>
75
+ 需要体现人物孤傲的气质
76
+ 加入武侠特有的环境描写
77
+ 保持对话的冷峻风格
78
+ </think>
79
+ <楚夜>"""
80
+ ```
81
 
82
+ **参数推荐**:
83
+ ```python
84
+ generation_config = {
85
+ "temperature": 0.8,
86
+ "top_p": 0.8,
87
+ "repetition_penalty": 1.17,
88
+ "max_new_tokens": 1536,
89
+ "do_sample": True
90
+ }
91
  ```
92
 
93
  ## 致谢