File size: 3,920 Bytes
f6f5c68 61906d3 f6f5c68 61906d3 02f9218 04239a0 61906d3 b2f072b 02f9218 04239a0 dc89a09 8752476 844a8a9 f1a496a 04239a0 a7b02af d3664f7 a7b02af 04239a0 61906d3 601fc67 02f9218 04239a0 601fc67 c344cd8 5f53df4 61906d3 5f53df4 32a90d4 e935854 ae85ac9 b2f072b ae85ac9 b3909cc ae85ac9 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 |
---
license: cc-by-nc-sa-4.0
language:
- zh
---
Sakura-GalTransl模型由sakuraumi和xd2333共同构建,为视觉小说(Galgame)翻译任务专项优化。模型参数量7B,支持日译简中(jp2zh-cn)。
**Sakura-GalTransl模型继承sakura模型cc-by-nc-sa 4.0协议,禁止用于商用行为,例如提供付费翻译接口、制作需要以任何方式付费才能获取的补丁、商用翻译等。**
### 特性:
* 为视觉小说(Galgame)翻译任务专项优化。对视觉小说脚本中的行内换行、控制符、ruby注音等符号具有较好的保留能力。
* 尝试在硬件需求、翻译质量与稳定性间取得平衡。模型可以运行在(空闲显存≥6g)的主流游戏显卡或Macbook上,并获得在整体上高度可用的翻译质量和稳定性。
* 为[GalTransl视觉小说翻译工具](https://github.com/xd2333/GalTransl)适配并调优,支持GPT字典([字典写法见此](https://github.com/xd2333/GalTransl/wiki/GPT%E5%AD%97%E5%85%B8%E2%80%90Sakura%E4%B8%8EGaltransl%E6%A8%A1%E5%9E%8B))。
* 也支持使用lunatranslator等工具在线翻译。
### 更新日志:
25.03.22 v3.0:基于Sakura-7B-Qwen2.5-v1.0并使用GRPO对模型进行强化,翻译质量显著优于上一代GalTransl模型
24.10.04 v2.6:在2.5的基础上提高了稳定性
24.09.30 v2.5:抑制了一些已知问题,并且在对比v2时文风更细腻
24.08.08 v2.0:继续迭代以改善质量
24.06.30 v1.5:优化了整体的文风
24.05.30 v1.0:初版
### 快速部署:
* Win建议使用[Sakura_Launcher_GUI](https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI)部署,在 release 里下载
* Mac可以使用[run_Sakura_any.zip](https://huggingface.co/SakuraLLM/Sakura-GalTransl-7B-v3/blob/main/run_Sakura_any.zip),是同时支持 Win/Mac/Linux,N卡/A卡/Apple芯片的简化部署包
1. 解压后将模型丢进llm2run文件夹里
2. Win:双击run_Sakura_win.bat然后选择模型
Mac:先去 app store 安装 xcode,然后打开终端切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
Linux: Linux使用GPU需要安装CUDA SDK或HIP SDK,然后切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
4. 6G 显存 1 线程,8G 及以上显存可以设置 4-10 线程
* 启动失败可能是 8080 端口被占用,可以尝试[找到占用的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)
### 已知问题:
* GPT字典**不支持一词多译写法("a/b")**,将在以后的版本尝试改善。
* 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
* 推荐每次翻译**7-10句**
### 量化等级区别:
| 量化等级 | 说明 |
| ---- | ---- |
| IQ4_XS | 小的质量损失,占用更小,但速度比Q4_K慢(6G显存推荐) |
| Q4_K | 小的质量损失(6G显存推荐)|
| Q5_K | 很小的质量损失(6G/8G显存推荐) |
| Q6_k | 细小的质量损失(8G及以上显存推荐) |
### 请求方式
v3推荐温度0.6
v3请求模板:
system prompt
```
你是一个视觉小说翻译模型,可以通顺地使用给定的术语表以指定的风格将日文翻译成简体中文,并联系上下文正确使用人称代词,注意不要混淆使役态和被动态的主语和宾语,不要擅自添加原文中没有的特殊符号,也不要擅自增加或减少换行。
```
user prompt
```
[History]
参考以下术语表(可为空,格式为src->dst #备注):
[Glossary]
根据以上术语表的对应关系和备注,结合历史剧情和上下文,将下面的文本从日文翻译成简体中文:
[Input]
```
其中[History]格式为`历史翻译:`+上一轮翻译结果
[Glossary]格式为src->dst #备注
这两项都是可选项,可以留空 |