File size: 3,920 Bytes
f6f5c68
 
 
 
 
 
61906d3
f6f5c68
61906d3
02f9218
04239a0
61906d3
 
b2f072b
 
02f9218
04239a0
dc89a09
8752476
844a8a9
f1a496a
04239a0
 
 
a7b02af
d3664f7
 
 
a7b02af
 
 
 
 
 
 
 
 
04239a0
61906d3
601fc67
 
02f9218
04239a0
601fc67
 
 
c344cd8
5f53df4
61906d3
5f53df4
32a90d4
e935854
 
ae85ac9
 
 
b2f072b
ae85ac9
 
b3909cc
ae85ac9
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
---
license: cc-by-nc-sa-4.0
language:
- zh
---

Sakura-GalTransl模型由sakuraumi和xd2333共同构建,为视觉小说(Galgame)翻译任务专项优化。模型参数量7B,支持日译简中(jp2zh-cn)。   

**Sakura-GalTransl模型继承sakura模型cc-by-nc-sa 4.0协议,禁止用于商用行为,例如提供付费翻译接口、制作需要以任何方式付费才能获取的补丁、商用翻译等。**   

### 特性:   
* 为视觉小说(Galgame)翻译任务专项优化。对视觉小说脚本中的行内换行、控制符、ruby注音等符号具有较好的保留能力。   
* 尝试在硬件需求、翻译质量与稳定性间取得平衡。模型可以运行在(空闲显存≥6g)的主流游戏显卡或Macbook上,并获得在整体上高度可用的翻译质量和稳定性。   
* 为[GalTransl视觉小说翻译工具](https://github.com/xd2333/GalTransl)适配并调优,支持GPT字典([字典写法见此](https://github.com/xd2333/GalTransl/wiki/GPT%E5%AD%97%E5%85%B8%E2%80%90Sakura%E4%B8%8EGaltransl%E6%A8%A1%E5%9E%8B))。
* 也支持使用lunatranslator等工具在线翻译。

### 更新日志:
25.03.22 v3.0:基于Sakura-7B-Qwen2.5-v1.0并使用GRPO对模型进行强化,翻译质量显著优于上一代GalTransl模型   
24.10.04 v2.6:在2.5的基础上提高了稳定性   
24.09.30 v2.5:抑制了一些已知问题,并且在对比v2时文风更细腻   
24.08.08 v2.0:继续迭代以改善质量   
24.06.30 v1.5:优化了整体的文风   
24.05.30 v1.0:初版   

### 快速部署:  
* Win建议使用[Sakura_Launcher_GUI](https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI)部署,在 release 里下载

* Mac可以使用[run_Sakura_any.zip](https://huggingface.co/SakuraLLM/Sakura-GalTransl-7B-v3/blob/main/run_Sakura_any.zip),是同时支持 Win/Mac/Linux,N卡/A卡/Apple芯片的简化部署包   

1. 解压后将模型丢进llm2run文件夹里   
2. Win:双击run_Sakura_win.bat然后选择模型   
Mac:先去 app store 安装 xcode,然后打开终端切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`   
Linux: Linux使用GPU需要安装CUDA SDK或HIP SDK,然后切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`   
4. 6G 显存 1 线程,8G 及以上显存可以设置 4-10 线程   

* 启动失败可能是 8080 端口被占用,可以尝试[找到占用的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)   

### 已知问题:   
* GPT字典**不支持一词多译写法("a/b")**,将在以后的版本尝试改善。   
* 需要对原文省略语素进行推理时可能出现事实错误/幻觉。   
* 推荐每次翻译**7-10句**   

### 量化等级区别: 

| 量化等级 | 说明 |
| ---- | ---- |
| IQ4_XS | 小的质量损失,占用更小,但速度比Q4_K慢(6G显存推荐) |
| Q4_K | 小的质量损失(6G显存推荐)|
| Q5_K | 很小的质量损失(6G/8G显存推荐) |
| Q6_k | 细小的质量损失(8G及以上显存推荐) |


### 请求方式

v3推荐温度0.6   

v3请求模板:   
system prompt   
```
你是一个视觉小说翻译模型,可以通顺地使用给定的术语表以指定的风格将日文翻译成简体中文,并联系上下文正确使用人称代词,注意不要混淆使役态和被动态的主语和宾语,不要擅自添加原文中没有的特殊符号,也不要擅自增加或减少换行。
```

user prompt   
```
[History]
参考以下术语表(可为空,格式为src->dst #备注):
[Glossary]
根据以上术语表的对应关系和备注,结合历史剧情和上下文,将下面的文本从日文翻译成简体中文:
[Input]
```

其中[History]格式为`历史翻译:`+上一轮翻译结果   
[Glossary]格式为src->dst #备注   
这两项都是可选项,可以留空