Spaces:

kevinwang676
/

GPT-SoVITS-emo

Running

App Files Files Community

GPT-SoVITS-emo / docs /cn /Changelog_CN.md

kevinwang676

Upload folder using huggingface_hub

051c72a verified about 1 year ago

preview code

raw

history blame contribute delete

5.12 kB

	### 20240121更新

	1-config添加is_share，诸如colab等场景可以将此改为True，来使得webui映射到公网

	2-WebUI添加英文系统英文翻译适配

	3-cmd-asr自动判断是否已自带damo模型，如不在默认目录上将从modelscope自带下载

	4-[SoVITS训练报错ZeroDivisionError](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) 尝试修复（过滤长度0的样本等）

	5-清理TEMP文件夹缓存音频等文件

	6-大幅削弱合成音频包含参考音频结尾的问题

	### 20240122更新

	1-修复过短输出文件返回重复参考音频的问题。

	2-经测试，英文日文训练原生支持（日文训练需要根目录不含非英文等特殊字符）。

	3-音频路径检查。如果尝试读取输入错的路径报错路径不存在，而非ffmpeg错误。

	### 20240123更新

	1-解决hubert提取nan导致SoVITS/GPT训练报错ZeroDivisionError的问题

	2-支持推理界面快速切换模型

	3-优化模型文件排序逻辑

	4-中文分词使用jieba_fast代替jieba

	### 20240126更新

	1-支持输出文本中英混合、日英混合

	2-输出可选切分模式

	3-修复uvr5读取到目录自动跳出的问题

	4-修复多个换行导致推理报错

	5-去除推理界面大量冗余log

	6-支持mac训练推理

	7-自动识别不支持半精度的卡强制单精度。cpu推理下强制单精度。

	### 20240128更新

	1-修复数字转汉字念法问题

	2-修复句首少量字容易吞字的问题

	3-通过限制排除不合理的参考音频长度

	4-修复GPT训练不保存ckpt的问题

	5-完善Dockerfile的下载模型流程

	### 20240129更新

	1-16系等半精度训练有问题的显卡把训练配置改为单精度训练

	2-测试更新可用的colab版本

	3-修复git clone modelscope funasr仓库+老版本funasr导致接口不对齐报错的问题


	### 20240130更新

	1-所有涉及路径的地方双引号自动去除,小白复制路径带双引号不会报错

	2-修复中英文标点切割问题和句首句尾补标点的问题

	3-增加按标点符号切分

	### 20240201更新

	1-修复uvr5读取格式错误导致分离失败的问题

	2-支持中日英混合多种文本自动切分识别语种

	### 20240202更新

	1-修复asr路径尾缀带/保存文件名报错

	2-引入paddlespeech的Normalizer https://github.com/RVC-Boss/GPT-SoVITS/pull/377 修复一些问题，例如：xx.xx%(带百分号类)，元/吨会读成元吨而不是元每吨,下划线不再会报错

	### 20240207更新

	1-修正语种传参混乱导致中文推理效果下降 https://github.com/RVC-Boss/GPT-SoVITS/issues/391

	2-uvr5适配高版本librosa https://github.com/RVC-Boss/GPT-SoVITS/pull/403

	3-修复uvr5 inf everywhere报错的问题(is_half传参未转换bool导致恒定半精度推理，16系显卡会inf) https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8

	4-优化英文文本前端

	5-修复gradio依赖

	6-支持三连根目录留空自动读取.list全路径

	7-集成faster whisper ASR日文英文

	### 20240208更新

	1-GPT训练卡死（win10 1909）和https://github.com/RVC-Boss/GPT-SoVITS/issues/232 （系统语言繁体）GPT训练报错，[尝试修复](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)。

	### 20240212更新

	1-faster whisper和funasr逻辑优化。faster whisper转镜像站下载，规避huggingface连不上的问题。

	2-DPO Loss实验性训练选项开启，通过构造负样本训练缓解GPT重复漏字问题。推理界面公开几个推理参数。 https://github.com/RVC-Boss/GPT-SoVITS/pull/457

	### 20240214更新

	1-训练支持中文实验名（原来会报错）

	2-DPO训练改为可勾选选项而非必须。如勾选batch size自动减半。修复推理界面新参数不传参的问题。

	### 20240216更新

	1-支持无参考文本输入

	2-修复中文文本前端bug https://github.com/RVC-Boss/GPT-SoVITS/issues/475

	### 20240221更新

	1-数据处理添加语音降噪选项（降噪为只剩16k采样率，除非底噪很大先不急着用哦。）

	2-中文日文前端处理优化 https://github.com/RVC-Boss/GPT-SoVITS/pull/559 https://github.com/RVC-Boss/GPT-SoVITS/pull/556 https://github.com/RVC-Boss/GPT-SoVITS/pull/532 https://github.com/RVC-Boss/GPT-SoVITS/pull/507 https://github.com/RVC-Boss/GPT-SoVITS/pull/509

	3-mac CPU推理更快因此把推理设备从mps改到CPU

	4-colab修复不开启公网url

	### 20240306更新

	1-推理加速50%（RTX3090+pytorch2.2.1+cu11.8+win10+py39 tested）https://github.com/RVC-Boss/GPT-SoVITS/pull/672

	2-如果用faster whisper非中文ASR不再需要先下中文funasr模型

	3-修复uvr5去混响模型是否混响反的 https://github.com/RVC-Boss/GPT-SoVITS/pull/610

	4-faster whisper如果无cuda可用自动cpu推理 https://github.com/RVC-Boss/GPT-SoVITS/pull/675

	5-修改is_half的判断使在Mac上能正常CPU推理 https://github.com/RVC-Boss/GPT-SoVITS/pull/573


	todolist：

	1-中文多音字推理优化(有没有人来测试的，欢迎把测试结果写在pr评论区里) https://github.com/RVC-Boss/GPT-SoVITS/pull/488