Spaces:

k2-fsa
/

text-to-speech

Running

App Files Files Community

csukuangfj commited on Feb 8

Commit

a4b042c

1 Parent(s): ba2d69a

add kokoro 1.0

Browse files

Files changed (2) hide show

model.py +43 -1
requirements.txt +2 -2

model.py CHANGED Viewed

@@ -123,7 +123,10 @@ def _get_vits_ljs(repo_id: str, speed: float) -> sherpa_onnx.OfflineTts:
 def _get_kokoro(repo_id: str, speed: float) -> sherpa_onnx.OfflineTts:
     data_dir = "/tmp/espeak-ng-data"
     repo_id = repo_id.split("|")[0]
-    assert repo_id in ("csukuangfj/kokoro-en-v0_19",), repo_id
     model = get_file(
         repo_id=repo_id,
@@ -142,6 +145,41 @@ def _get_kokoro(repo_id: str, speed: float) -> sherpa_onnx.OfflineTts:
         filename="voices.bin",
         subfolder=".",
     )
     tts_config = sherpa_onnx.OfflineTtsConfig(
         model=sherpa_onnx.OfflineTtsModelConfig(
@@ -151,12 +189,15 @@ def _get_kokoro(repo_id: str, speed: float) -> sherpa_onnx.OfflineTts:
                 tokens=tokens,
                 data_dir=data_dir,
                 length_scale=1.0 / speed,
             ),
             provider="cpu",
             debug=True,
             num_threads=2,
         ),
         max_num_sentences=1,
     )
     tts = sherpa_onnx.OfflineTts(tts_config)
@@ -593,6 +634,7 @@ chinese_models = {
 }
 english_models = {
     "csukuangfj/kokoro-en-v0_19|11 speakers": _get_kokoro,
     "csukuangfj/vits-piper-en_US-glados|1 speaker": _get_vits_piper,
     "csukuangfj/vits-piper-en_GB-southern_english_male-medium|8 speakers": _get_vits_piper,

 def _get_kokoro(repo_id: str, speed: float) -> sherpa_onnx.OfflineTts:
     data_dir = "/tmp/espeak-ng-data"
     repo_id = repo_id.split("|")[0]
+    assert repo_id in (
+        "csukuangfj/kokoro-en-v0_19",
+        "csukuangfj/kokoro-multi-lang-v1_0",
+    ), repo_id
     model = get_file(
         repo_id=repo_id,
         filename="voices.bin",
         subfolder=".",
     )
+    if repo_id == "csukuangfj/kokoro-multi-lang-v1_0":
+        lexicon_en = get_file(
+            repo_id=repo_id,
+            filename="lexicon-us-en.txt",
+            subfolder=".",
+        )
+        lexicon_zh = get_file(
+            repo_id=repo_id,
+            filename="lexicon-zh.txt",
+            subfolder=".",
+        )
+        lexicon = f"{lexicon_en},{lexicon_zh}"
+        date_zh = get_file(
+            repo_id=repo_id,
+            filename="date-zh.fst",
+            subfolder=".",
+        )
+        number_zh = get_file(
+            repo_id=repo_id,
+            filename="number-zh.fst",
+            subfolder=".",
+        )
+        phone_zh = get_file(
+            repo_id=repo_id,
+            filename="phone-zh.fst",
+            subfolder=".",
+        )
+        rule_fsts = f"{date_zh},{phone_zh},{number_zh}"
+        dict_dir = "/tmp/dict"
+    else:
+        lexicon = ""
+        rule_fsts = ""
+        dict_dir = ""
     tts_config = sherpa_onnx.OfflineTtsConfig(
         model=sherpa_onnx.OfflineTtsModelConfig(
                 tokens=tokens,
                 data_dir=data_dir,
                 length_scale=1.0 / speed,
+                lexicon=lexicon,
+                dict_dir=dict_dir,
             ),
             provider="cpu",
             debug=True,
             num_threads=2,
         ),
         max_num_sentences=1,
+        rule_fsts=rule_fsts,
     )
     tts = sherpa_onnx.OfflineTts(tts_config)
 }
 english_models = {
+    "csukuangfj/kokoro-multi-lang-v1_0|53 speakers": _get_kokoro,
     "csukuangfj/kokoro-en-v0_19|11 speakers": _get_kokoro,
     "csukuangfj/vits-piper-en_US-glados|1 speaker": _get_vits_piper,
     "csukuangfj/vits-piper-en_GB-southern_english_male-medium|8 speakers": _get_vits_piper,

requirements.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-https://huggingface.co/csukuangfj/sherpa-onnx-wheels/resolve/main/cpu/1.10.39/sherpa_onnx-1.10.39-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl
-#sherpa-onnx>=1.10.37
 soundfile

+https://huggingface.co/csukuangfj/sherpa-onnx-wheels/resolve/main/cpu/1.10.42/sherpa_onnx-1.10.42-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl
+#sherpa-onnx>=1.10.42
 soundfile