Upload 3 files

Browse files

Files changed (4) hide show

.gitattributes +1 -0
LibriTTS960_50Hz.json +63 -0
LibriTTS960_50Hz.safetensors +3 -0
focalcodec.png +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+focalcodec.png filter=lfs diff=lfs merge=lfs -text

LibriTTS960_50Hz.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "encoder_name": "WavLM",
+  "encoder_config": {
+    "hidden_dims": [512, 512, 512, 512, 512, 512, 512],
+    "kernel_sizes": [10, 3, 3, 3, 3, 2, 2],
+    "strides": [5, 2, 2, 2, 2, 2, 2],
+    "num_layers": 6,
+    "dim": 1024,
+    "ffn_dim": 4096,
+    "num_heads": 16,
+    "num_buckets": 320,
+    "max_distance": 800,
+    "dropout": 0.0,
+    "conv_pos": 128,
+    "conv_pos_groups": 16
+  },
+  "compressor_name": "FocalEncoder",
+  "compressor_config": {
+    "input_dim": 1024,
+    "output_dim": 13,
+    "hidden_dims": [1024, 512, 256],
+    "downscale_factors": [1, 1, 1],
+    "focal_window": 7,
+    "focal_level": 2,
+    "focal_factor": 2,
+    "dropout": 0.0,
+    "use_post_norm": false,
+    "use_layerscale": false,
+    "layerscale_init": 0.0001,
+    "normalize_modulator": false
+  },
+  "quantizer_name": "BinarySphericalQuantizer",
+  "quantizer_config": {
+    "codebook_size": 8192
+  },
+  "decompressor_name": "FocalDecoder",
+  "decompressor_config": {
+    "input_dim": 13,
+    "output_dim": 1024,
+    "hidden_dims": [256, 512, 1024],
+    "upscale_factors": [1, 1, 1],
+    "focal_window": 7,
+    "focal_level": 2,
+    "focal_factor": 2,
+    "dropout": 0.0,
+    "use_post_norm": false,
+    "use_layerscale": false,
+    "layerscale_init": 0.0001,
+    "normalize_modulator": false
+  },
+  "decoder_name": "Vocos",
+  "decoder_config": {
+    "input_channels": 1024,
+    "num_layers": 8,
+    "dim": 512,
+    "ffn_dim": 1536,
+    "kernel_size": 7,
+    "padding": 3,
+    "layerscale_init": null,
+    "n_fft": 1024,
+    "hop_length": 320
+  }
+}

LibriTTS960_50Hz.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2700a916ca8d1c11a899995ef8d451ee53a481486650c4b78cd96feff9ac77f0
+size 568554604

focalcodec.png ADDED Viewed

Git LFS Details

SHA256: 93eefb4b78b4ee860c678e8408456516082ef4f6fcf9cce9a831e234ea260b84
Pointer size: 131 Bytes
Size of remote file: 406 kB