Spaces:

7Miiik
/

TextoAConversacionApp

Sleeping

App Files Files Community

7Miiik commited on Sep 25, 2024

Commit

2b3b2a1

verified ·

1 Parent(s): 8bcb7f5

Update app.py

Browse files

Files changed (1) hide show

app.py +70 -52

app.py CHANGED Viewed

@@ -1,17 +1,51 @@
 import gradio as gr
 from transformers import pipeline
 import os
-from gtts import gTTS  # Importamos gTTS
-# Función para convertir texto a audio
-def convertir_texto_a_audio(texto, nombre_archivo):
-    tts = gTTS(text=texto, lang='es')
-    tts.save(nombre_archivo)
-# Creamos un modelo de resumen más ligero
-resumidor = pipeline("summarization", model="t5-small")
-# Creamos un modelo de generación de diálogo más ligero
 dialogador = pipeline("text-generation", model="microsoft/DialoGPT-small")
 def transformar_texto(archivo):
@@ -19,77 +53,61 @@ def transformar_texto(archivo):
         raise gr.Error("Por favor, sube un archivo de texto.")
     try:
-        # Lee el contenido del archivo subido
         with open(archivo.name, 'r', encoding='utf-8') as f:
             texto = f.read()
     except Exception as e:
         raise gr.Error(f"Error al leer el archivo: {e}")
-    # Limitación para la versión gratuita
-    max_palabras = 1000  # Puedes ajustar este número
     num_palabras = len(texto.split())
     if num_palabras > max_palabras:
-        raise gr.Error(f"El texto excede el límite de {max_palabras} palabras para la versión gratuita.")
     try:
-        # Resumimos el texto
-        resumen = resumidor(
-            texto,
-            max_length=50,
-            min_length=25,
-            do_sample=False,
-            clean_up_tokenization_spaces=True
-        )[0]['summary_text']
-    except Exception as e:
-        raise gr.Error(f"Error al resumir el texto: {e}")
-    try:
-        # Generamos una conversación basada en el resumen
-        prompt = f"Crear una conversación entre dos personas sobre: {resumen}"
         conversacion = dialogador(
             prompt,
-            max_length=200,
             num_return_sequences=1,
             clean_up_tokenization_spaces=True
         )[0]['generated_text']
     except Exception as e:
         raise gr.Error(f"Error al generar la conversación: {e}")
-    # Convertimos la conversación a audio
-    ruta_audio = os.path.join("/tmp", "conversacion.mp3")
-    try:
-        convertir_texto_a_audio(conversacion, ruta_audio)
-    except Exception as e:
-        raise gr.Error(f"Error al convertir texto a audio: {e}")
-    return ruta_audio
-# Creamos la interfaz de usuario actualizada
 interfaz = gr.Interface(
     fn=transformar_texto,
     inputs=gr.File(label="Sube tu documento de texto (.txt)"),
     outputs=gr.Audio(type="filepath", label="Escucha la conversación generada"),
     title="📝➡️🎙️ Transformador de Texto a Conversación",
-    description="""
-    Sube un documento de texto y conviértelo en una conversación tipo podcast entre dos personas.
-    **Versión Gratuita:**
-    - Límite de 1000 palabras por texto.
-    - Conversación básica entre dos personas.
-    **Próximamente:**
-    - Versiones premium sin límites.
-    - Personalización de voces y estilos.
-    - Descarga en formato de audio.
-    ¡Mantente atento para más actualizaciones!
-    """,  # Asegúrate de que las comillas triples cierran aquí
     theme="default",
     allow_flagging="never"
 )
 interfaz.launch()

 import gradio as gr
 from transformers import pipeline
 import os
+from TTS.api import TTS
+from pydub import AudioSegment
+# Inicializar los modelos de Coqui TTS para dos voces
+tts_juan = TTS(model_name="tts_models/es/mai/tacotron2-DDC", progress_bar=False, gpu=False)
+tts_maria = TTS(model_name="tts_models/es/css10/vits", progress_bar=False, gpu=False)
+# Función para convertir texto a audio con voces diferentes
+def convertir_texto_a_audio(texto, nombre_archivo, voz):
+    if voz == "Juan":
+        tts_juan.tts_to_file(text=texto, file_path=nombre_archivo)
+    elif voz == "María":
+        tts_maria.tts_to_file(text=texto, file_path=nombre_archivo)
+    else:
+        # Voz predeterminada
+        tts_juan.tts_to_file(text=texto, file_path=nombre_archivo)
+def procesar_conversacion(conversacion):
+    lineas = conversacion.strip().split('\n')
+    dialogos = []
+    for linea in lineas:
+        if linea.startswith("Juan:"):
+            dialogos.append(("Juan", linea.replace("Juan:", "").strip()))
+        elif linea.startswith("María:"):
+            dialogos.append(("María", linea.replace("María:", "").strip()))
+    return dialogos
+def generar_audio_conversacion(dialogos):
+    audios = []
+    for idx, (persona, texto) in enumerate(dialogos):
+        ruta_audio = os.path.join("/tmp", f"dialogo_{idx}.wav")
+        convertir_texto_a_audio(texto, ruta_audio, persona)
+        audios.append(ruta_audio)
+    return audios
+def combinar_audios(rutas_audios):
+    conversacion_audio = AudioSegment.empty()
+    for ruta in rutas_audios:
+        audio = AudioSegment.from_file(ruta)
+        conversacion_audio += audio
+    ruta_final = os.path.join("/tmp", "conversacion_final.wav")
+    conversacion_audio.export(ruta_final, format="wav")
+    return ruta_final
+# Creamos el modelo de generación de diálogo
 dialogador = pipeline("text-generation", model="microsoft/DialoGPT-small")
 def transformar_texto(archivo):
         raise gr.Error("Por favor, sube un archivo de texto.")
     try:
         with open(archivo.name, 'r', encoding='utf-8') as f:
             texto = f.read()
     except Exception as e:
         raise gr.Error(f"Error al leer el archivo: {e}")
+    max_palabras = 1000
     num_palabras = len(texto.split())
     if num_palabras > max_palabras:
+        raise gr.Error(f"El texto excede el límite de {max_palabras} palabras.")
     try:
+        # Generamos la conversación utilizando el texto completo
+        prompt = f"""
+        Crear una conversación entre dos personas, Juan y María, donde Juan hace preguntas sobre el siguiente texto y María responde:
+        {texto}
+        La conversación debe estar en el siguiente formato:
+        Juan: [pregunta]
+        María: [respuesta]
+        Juan: [pregunta]
+        María: [respuesta]
+        ...
+        La conversación debe ser educativa y cubrir los puntos principales del texto.
+        """
         conversacion = dialogador(
             prompt,
+            max_length=2000,
             num_return_sequences=1,
             clean_up_tokenization_spaces=True
         )[0]['generated_text']
     except Exception as e:
         raise gr.Error(f"Error al generar la conversación: {e}")
+    # Procesamos la conversación y generamos los audios
+    dialogos = procesar_conversacion(conversacion)
+    rutas_audios = generar_audio_conversacion(dialogos)
+    ruta_audio_final = combinar_audios(rutas_audios)
+    return ruta_audio_final
+# Crear la interfaz de usuario
 interfaz = gr.Interface(
     fn=transformar_texto,
     inputs=gr.File(label="Sube tu documento de texto (.txt)"),
     outputs=gr.Audio(type="filepath", label="Escucha la conversación generada"),
     title="📝➡️🎙️ Transformador de Texto a Conversación",
+    description="Sube un documento de texto y conviértelo en una conversación educativa entre dos personas.",
     theme="default",
     allow_flagging="never"
 )
 interfaz.launch()