xTTS-fr-cpu

Running

App Files Files Community

Woziii commited on Nov 25, 2024

Commit

11501d1

verified ·

1 Parent(s): 0df1e09

Update app.py

Browse files

Files changed (1) hide show

app.py +131 -112

app.py CHANGED Viewed

@@ -6,125 +6,144 @@ import time
 import torch
 tts = TTS("tts_models/multilingual/multi-dataset/xtts_v2", gpu=False)
 output_folder = "output_audio"
 os.makedirs(output_folder, exist_ok=True)
-def predict(prompt, speaker, agree, subfolder_name, file_name):
     if not agree:
-        raise gr.Error("Veuillez accepter les conditions d'utilisation.")
-    subfolder_name = subfolder_name.strip() or f"session_{int(time.time())}"
-    session_folder = os.path.join(output_folder, subfolder_name)
-    os.makedirs(session_folder, exist_ok=True)
-    file_name = file_name.strip() or "output.wav"
-    if not file_name.endswith(".wav"):
-        file_name += ".wav"
-    output_path = os.path.join(session_folder, file_name)
-    speaker_wav_paths = [os.path.join("examples", f) for f in os.listdir("examples") if f.startswith(speaker) and f.endswith(".wav")]
-    if not speaker_wav_paths:
-        raise gr.Error(f"Aucun fichier audio trouvé pour le speaker : {speaker}")
-    tts.tts_to_file(
-        text=prompt,
-        file_path=output_path,
-        speaker_wav=speaker_wav_paths,
-        language="fr"
-    )
-    return output_path
-custom_css = """
-.gradio-container {
-    font-family: 'Roboto', sans-serif;
-    background-color: #f7f9fc;
-}
-.gr-form {
-    background-color: white;
-    border-radius: 15px;
-    padding: 30px;
-    box-shadow: 0 8px 16px rgba(0, 0, 0, 0.1);
-}
-.gr-button {
-    background-color: #4a90e2;
-    border: none;
-    color: white;
-    font-weight: bold;
-    transition: all 0.3s ease;
-}
-.gr-button:hover {
-    background-color: #3a7bc8;
-    transform: translateY(-2px);
-}
-.gr-input, .gr-dropdown {
-    border: 1px solid #e0e0e0;
-    border-radius: 8px;
-    padding: 10px;
-}
-.gr-checkbox {
-    margin-top: 10px;
-}
-.gr-form > div {
-    margin-bottom: 20px;
-}
-"""
-title = "🎙️ Synthèse Vocale XTTS"
-description = """
-<h3 style='text-align: center; margin-bottom: 1em;'>Bienvenue sur notre outil de synthèse vocale XTTS !</h3>
-<p style='text-align: center;'>Générez une voix naturelle à partir de votre texte en français. Choisissez une voix, entrez votre texte, et écoutez le résultat !</p>
-"""
-article = """
-<div style='margin: 20px auto; text-align: center; padding: 10px; background-color: #e8f0fe; border-radius: 10px;'>
-<p>En utilisant cette démo, vous acceptez les <a href='https://coqui.ai/cpml' target='_blank' style='color: #4a90e2; text-decoration: none;'>conditions d'utilisation du modèle Coqui Public</a></p>
-</div>
-"""
-available_speakers = list(set([f.split('_')[0] for f in os.listdir("examples") if f.endswith(".wav")]))
-with gr.Blocks(css=custom_css) as demo:
-    gr.Markdown(f"<h1 style='text-align: center; color: #4a90e2;'>{title}</h1>")
-    gr.Markdown(description)
-    with gr.Row():
-        with gr.Column(scale=2):
-            prompt = gr.Textbox(
-                label="Texte pour la synthèse vocale",
-                info="Une ou deux phrases à la fois sont préférables (max : 10)",
-                placeholder="Bonjour ! Comment allez-vous aujourd'hui ?",
-                lines=5
-            )
-        with gr.Column(scale=1):
-            speaker = gr.Dropdown(
-                label="Voix",
-                choices=available_speakers,
-                value=available_speakers[0] if available_speakers else None
-            )
-            agree = gr.Checkbox(
-                label="J'accepte les conditions d'utilisation",
-                value=False
-            )
-            subfolder_name = gr.Textbox(
-                label="Nom du sous-dossier (facultatif)",
-                placeholder="Nom du sous-dossier pour stocker l'audio"
-            )
-            file_name = gr.Textbox(
-                label="Nom du fichier (facultatif)",
-                placeholder="Nom du fichier audio généré"
-            )
-    generate_btn = gr.Button("Générer la voix", variant="primary")
-    audio_output = gr.Audio(label="Audio généré")
-    generate_btn.click(
-        predict,
-        inputs=[prompt, speaker, agree, subfolder_name, file_name],
-        outputs=[audio_output]
-    )
-    gr.Markdown(article)
 demo.launch(debug=True)

 import torch
+# Initialisation du modèle TTS avec GPU désactivé
 tts = TTS("tts_models/multilingual/multi-dataset/xtts_v2", gpu=False)
+# Répertoire de sortie pour tous les fichiers audio
 output_folder = "output_audio"
 os.makedirs(output_folder, exist_ok=True)
+# Fonction pour générer un fichier audio à partir d'une section
+def generate_section_audio(project_name, section_name, text, speaker):
+    try:
+        # Création du sous-dossier pour le projet
+        project_path = os.path.join(output_folder, project_name)
+        os.makedirs(project_path, exist_ok=True)
+        # Définir le chemin de sortie pour cette section
+        file_name = f"{section_name}.wav"
+        output_path = os.path.join(project_path, file_name)
+        # Vérifier la disponibilité des fichiers audio pour le speaker
+        speaker_wav_paths = [os.path.join("examples", f) for f in os.listdir("examples") if f.startswith(speaker) and f.endswith(".wav")]
+        if not speaker_wav_paths:
+            raise ValueError(f"Aucun fichier audio trouvé pour le speaker : {speaker}")
+        # Génération de l'audio
+        tts.tts_to_file(
+            text=text,
+            file_path=output_path,
+            speaker_wav=speaker_wav_paths,
+            language="fr"
+        )
+        return output_path  # Retourne le chemin de l'audio généré
+    except Exception as e:
+        return str(e)  # Retourne l'erreur pour gestion dans l'interface
+# Fonction pour traiter un projet complet
+def process_project(project_name, sections, speaker):
+    results = []
+    for section in sections:
+        section_name, text = section["name"], section["text"]
+        result = generate_section_audio(project_name, section_name, text, speaker)
+        results.append({"section": section_name, "result": result})
+    return results
+# Fonction de validation des conditions d'utilisation
+def validate_conditions(agree):
     if not agree:
+        raise gr.Error("❗ Veuillez accepter les conditions d'utilisation pour continuer.")
+# Interface Gradio
+with gr.Blocks() as demo:
+    # Titre principal
+    gr.Markdown("# 🎙️ Synthèse Vocale Margaux")
+    # Introduction et explication globale
+    gr.Markdown("""
+    ## 👋 Bienvenue sur Margaux - Votre outil de synthèse vocale avancée
+    Margaux vous permet de générer des voix off naturelles à partir de textes, structurées par sections pour une meilleure qualité audio.
+    **Étapes principales :**
+    1. 🛠️ **Créer un projet** : Définissez le nom du projet et choisissez la voix.
+    2. ✍️ **Ajouter des sections** : Divisez votre texte en parties claires, chacune avec un nom unique.
+    3. 🎧 **Générer les audios** : Chaque section est transformée en fichier audio individuel.
+    4. 🔄 **Écoutez et ajustez** : Régénérez les audios si nécessaire, indépendamment des autres.
+    5. 📁 **Sauvegardez le projet** : Finalisez et récupérez les fichiers validés.
+    """)
+    # Étape 1 : Création du Projet
+    with gr.Box():
+        gr.Markdown("### 🛠️ Étape 1 : Création du Projet")
+        gr.Markdown("**📂 Définissez les informations générales pour votre projet.**")
+        gr.Markdown("Le nom du projet servira à organiser vos fichiers dans un dossier dédié.")
+        project_name = gr.Textbox(label="Nom du Projet", placeholder="Exemple : Capsule_Video_PLU")
+        speaker = gr.Dropdown(label="Voix 🎙️", choices=["Margaux"], value="Margaux")  # Liste de voix
+        agree = gr.Checkbox(label="✅ J'accepte les conditions d'utilisation")
+        create_project_btn = gr.Button("Créer le Projet 🚀")
+    # Étape 2 : Gestion des Sections
+    with gr.Box():
+        gr.Markdown("### ✍️ Étape 2 : Ajoutez vos Sections")
+        gr.Markdown("""
+        **📝 Divisez votre script en plusieurs sections pour une meilleure qualité.**
+        Chaque section doit avoir :
+        - Un **nom unique** 🏷️ qui servira à nommer le fichier audio.
+        - Un **texte clair et concis** ✏️.
+        """)
+        sections = gr.State([])  # Liste des sections dynamiques
+        sections_list = gr.Column()  # Conteneur pour les sections ajoutées dynamiquement
+        add_section_btn = gr.Button("+ Ajouter une Section ➕")
+        remove_section_btn = gr.Button("- Supprimer la dernière Section ➖")
+    # Étape 3 : Validation des Sections et Génération des Audios
+    with gr.Box():
+        gr.Markdown("### 🎧 Étape 3 : Génération des Audios")
+        gr.Markdown("""
+        **🎶 Générez un fichier audio pour chaque section.**
+        - 🔄 Régénérez l’audio d’une section indépendamment si nécessaire.
+        - ⚠️ En cas d’erreur, seuls les audios de sections valides seront disponibles.
+        """)
+        generate_btn = gr.Button("Générer les Audios ▶️")
+        results_output = gr.Column()  # Conteneur pour les audios générés
+    # Étape 4 : Sauvegarde Finale
+    with gr.Box():
+        gr.Markdown("### 📁 Étape 4 : Sauvegarde Finale")
+        gr.Markdown("""
+        **💾 Une fois satisfait des résultats :**
+        - Cliquez sur **Sauvegarder** pour conserver uniquement les fichiers validés.
+        - Les fichiers seront organisés dans un dossier au nom de votre projet.
+        """)
+        save_project_btn = gr.Button("Sauvegarder le Projet ✅")
+    # Actions des Boutons
+    def create_project(project_name, speaker, agree):
+        validate_conditions(agree)
+        os.makedirs(os.path.join(output_folder, project_name), exist_ok=True)
+        return f"✅ Projet '{project_name}' créé avec succès !"
+    create_project_btn.click(create_project, inputs=[project_name, speaker, agree], outputs=[])
+    def add_section(sections):
+        section = {"name": f"Section_{len(sections) + 1}", "text": ""}
+        sections.append(section)
+        return sections
+    add_section_btn.click(add_section, inputs=[sections], outputs=[sections_list])
+    def remove_section(sections):
+        if sections:
+            sections.pop()
+        return sections
+    remove_section_btn.click(remove_section, inputs=[sections], outputs=[sections_list])
+    def generate_audios(project_name, sections, speaker):
+        results = process_project(project_name, sections, speaker)
+        return results
+    generate_btn.click(generate_audios, inputs=[project_name, sections, speaker], outputs=[results_output])
+# Lancement de l'interface
 demo.launch(debug=True)