facebook
/

xm_transformer_s2ut_en-hk

speech-to-speech-translation

Model card Files Files and versions Community

lpw commited on Oct 13, 2022

Commit

ee96a04

·

1 Parent(s): 9bd2304

Update README.md

Files changed (1) hide show

README.md +6 -8

README.md CHANGED Viewed

@@ -12,16 +12,14 @@ datasets:
 - covost2
 - europarl_st
 - voxpopuli
-widget:
-- example_title: Common Voice sample 1
-  src: https://huggingface.co/facebook/xm_transformer_600m-es_en-multi_domain/resolve/main/common_voice_es_19966634.flac
 ---
-## xm_transformer_s2ut_800m-es-en-st-asr-bt_h1_2022
 Speech-to-speech translation model from fairseq S2UT ([paper](https://arxiv.org/abs/2204.02967)/[code](https://github.com/facebookresearch/fairseq/blob/main/examples/speech_to_speech/docs/enhanced_direct_s2st_discrete_units.md)):
-- Spanish-English
 - Trained on mTEDx, CoVoST 2, Europarl-ST and VoxPopuli
-- Speech synthesis with [facebook/unit_hifigan_mhubert_vp_en_es_fr_it3_400k_layer11_km1000_lj_dur](https://huggingface.co/facebook/unit_hifigan_mhubert_vp_en_es_fr_it3_400k_layer11_km1000_lj_dur)
 ## Usage
 ```python
@@ -42,7 +40,7 @@ import torchaudio
 cache_dir = os.getenv("HUGGINGFACE_HUB_CACHE")
 models, cfg, task = load_model_ensemble_and_task_from_hf_hub(
-    "facebook/xm_transformer_s2ut_800m-es-en-st-asr-bt_h1_2022",
     arg_overrides={"config_yaml": "config.yaml", "task": "speech_to_text"},
     cache_dir=cache_dir,
 )
@@ -63,7 +61,7 @@ cache_dir = (
     cache_dir or (Path.home() / ".cache" / library_name).as_posix()
 )
 cache_dir = snapshot_download(
-    f"facebook/unit_hifigan_mhubert_vp_en_es_fr_it3_400k_layer11_km1000_lj_dur", cache_dir=cache_dir, library_name=library_name
 )
 x = hub_utils.from_pretrained(

 - covost2
 - europarl_st
 - voxpopuli
 ---
+## xm_transformer_s2ut_en-hk
 Speech-to-speech translation model from fairseq S2UT ([paper](https://arxiv.org/abs/2204.02967)/[code](https://github.com/facebookresearch/fairseq/blob/main/examples/speech_to_speech/docs/enhanced_direct_s2st_discrete_units.md)):
+- English-Hokkien
 - Trained on mTEDx, CoVoST 2, Europarl-ST and VoxPopuli
+- Speech synthesis with [facebook/unit_hifigan_HK_layer12.km2500_frame_TAT-TTS](https://huggingface.co/facebook/unit_hifigan_HK_layer12.km2500_frame_TAT-TTS)
 ## Usage
 ```python
 cache_dir = os.getenv("HUGGINGFACE_HUB_CACHE")
 models, cfg, task = load_model_ensemble_and_task_from_hf_hub(
+    "facebook/xm_transformer_s2ut_en-hk",
     arg_overrides={"config_yaml": "config.yaml", "task": "speech_to_text"},
     cache_dir=cache_dir,
 )
     cache_dir or (Path.home() / ".cache" / library_name).as_posix()
 )
 cache_dir = snapshot_download(
+    f"facebook/unit_hifigan_HK_layer12.km2500_frame_TAT-TTS", cache_dir=cache_dir, library_name=library_name
 )
 x = hub_utils.from_pretrained(