File size: 7,689 Bytes
1f72b0c
 
b808439
1088ad0
 
1f72b0c
beea2cf
1088ad0
1f72b0c
 
 
1088ad0
beea2cf
1088ad0
 
1f72b0c
1088ad0
 
 
1f72b0c
 
 
1088ad0
1f72b0c
1088ad0
 
1f72b0c
1088ad0
 
1f72b0c
 
1088ad0
beea2cf
1088ad0
beea2cf
1088ad0
beea2cf
1088ad0
 
 
 
beea2cf
1088ad0
beea2cf
 
 
1088ad0
beea2cf
 
1088ad0
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
beea2cf
1088ad0
beea2cf
1f72b0c
 
1088ad0
beea2cf
1088ad0
beea2cf
57af5e5
1f72b0c
beea2cf
 
 
 
1088ad0
beea2cf
1088ad0
beea2cf
1088ad0
beea2cf
 
1088ad0
beea2cf
1f72b0c
1088ad0
 
beea2cf
 
1088ad0
 
beea2cf
 
 
1088ad0
beea2cf
 
 
1088ad0
 
 
 
 
 
 
fb4e1f4
1088ad0
 
57af5e5
1088ad0
 
 
 
 
 
 
beea2cf
1088ad0
beea2cf
 
d80bdda
beea2cf
1088ad0
 
 
 
 
1f72b0c
1088ad0
1f72b0c
 
1088ad0
1f72b0c
1088ad0
 
 
 
 
 
1f72b0c
1088ad0
ee5aeee
 
1f72b0c
1088ad0
 
 
 
1f72b0c
 
1088ad0
1f72b0c
 
1088ad0
 
 
 
1f72b0c
 
 
57af5e5
1f72b0c
 
 
 
1088ad0
1f72b0c
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
import math
import tempfile
import logging
import os
import asyncio
from moviepy.editor import (
    VideoFileClip, AudioFileClip, ImageClip,
    concatenate_videoclips, CompositeVideoClip, CompositeAudioClip
)
import edge_tts
import gradio as gr
from pydub import AudioSegment

# Configuración de Logs
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

# CONSTANTES DE ARCHIVOS
INTRO_VIDEO = "introvideo.mp4"
OUTRO_VIDEO = "outrovideo.mp4"
MUSIC_BG = "musicafondo.mp3"
FX_SOUND = "fxsound.mp3"
WATERMARK = "watermark.png"
EJEMPLO_VIDEO = "ejemplo.mp4"  # Video de ejemplo en el root

# Validar existencia de archivos obligatorios
for file in [INTRO_VIDEO, OUTRO_VIDEO, MUSIC_BG, FX_SOUND, WATERMARK, EJEMPLO_VIDEO]:
    if not os.path.exists(file):
        logging.error(f"Falta archivo necesario: {file}")
        raise FileNotFoundError(f"Falta archivo necesario: {file}")

def cortar_video(video_path, metodo="inteligente", duracion=10):
    """Corta el video en clips según el método especificado."""
    try:
        logging.info("Iniciando corte de video...")
        video = VideoFileClip(video_path)
        
        if metodo == "manual":
            clips = [video.subclip(i * duracion, (i + 1) * duracion)
                     for i in range(math.ceil(video.duration / duracion))]
            logging.info(f"Video cortado en {len(clips)} clips manuales.")
            return clips
        
        # Método "inteligente" simplificado (cortes cada 5 segundos como fallback)
        clips = []
        ultimo_corte = 0
        for i in range(1, math.ceil(video.duration)):
            if i % 5 == 0:  # Corte cada 5 segundos (puedes mejorar esto con VAD más adelante)
                clips.append(video.subclip(ultimo_corte, i))
                ultimo_corte = i
        if ultimo_corte < video.duration:
            clips.append(video.subclip(ultimo_corte, video.duration))
        logging.info(f"Video cortado en {len(clips)} clips automáticos.")
        return clips
    except Exception as e:
        logging.error(f"Error al cortar video: {e}")
        raise

async def procesar_audio(texto, voz, duracion_total, duracion_intro, duracion_video_editado):
    """Genera el TTS y mezcla con la música de fondo."""
    try:
        logging.info("Generando TTS y mezclando audio...")
        communicate = edge_tts.Communicate(texto, voz)
        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp:
            await communicate.save(tmp.name)
            tts_audio = AudioFileClip(tmp.name)
        
        # Ajustar duración del TTS
        if tts_audio.duration > duracion_video_editado:
            tts_audio = tts_audio.subclip(0, duracion_video_editado)
        
        # Preparar música de fondo
        bg_music = AudioSegment.from_mp3(MUSIC_BG)
        if len(bg_music) < duracion_total * 1000:
            bg_music = bg_music * math.ceil(duracion_total * 1000 / len(bg_music))
        bg_music = bg_music[:duracion_total * 1000].fade_out(3000)
        
        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp:
            bg_music.export(tmp.name, format="mp3")
            bg_audio = AudioFileClip(tmp.name).volumex(0.10)
        
        # Combinar audios
        audio_final = CompositeAudioClip([
            bg_audio,
            tts_audio.volumex(0.9).set_start(duracion_intro)
        ])
        logging.info("Audio procesado correctamente.")
        return audio_final
    except Exception as e:
        logging.error(f"Error al procesar audio: {e}")
        raise

def agregar_transiciones(clips):
    """Agrega transiciones con watermark y sonido FX entre clips."""
    try:
        logging.info("Agregando transiciones...")
        fx_audio = AudioFileClip(FX_SOUND).set_duration(2.5)
        transicion = ImageClip(WATERMARK).set_duration(2.5).resize(height=clips[0].h).set_position(("center", 0.1))
        
        clips_con_fx = []
        for i, clip in enumerate(clips):
            clip_watermarked = CompositeVideoClip([clip, transicion])
            clips_con_fx.append(clip_watermarked)
            if i < len(clips) - 1:
                clips_con_fx.append(
                    CompositeVideoClip([transicion.set_position("center")]).set_audio(fx_audio)
                )
        logging.info("Transiciones agregadas correctamente.")
        return concatenate_videoclips(clips_con_fx)
    except Exception as e:
        logging.error(f"Error al agregar transiciones: {e}")
        raise

async def procesar_video(video_input, texto_tts, voz_seleccionada, metodo_corte, duracion_corte):
    """Procesa el video completo con intro, cortes, TTS y outro."""
    temp_files = []
    try:
        logging.info("Iniciando procesamiento de video...")
        # Cortar y editar video
        clips = cortar_video(video_input, metodo_corte, duracion_corte)
        video_editado = agregar_transiciones(clips)
        
        # Cargar intro y outro
        intro = VideoFileClip(INTRO_VIDEO)
        outro = VideoFileClip(OUTRO_VIDEO)
        
        # Calcular duraciones
        duracion_intro = intro.duration
        duracion_video_editado = video_editado.duration
        duracion_total = duracion_intro + duracion_video_editado + outro.duration
        
        # Concatenar clips
        video_final = concatenate_videoclips([intro, video_editado, outro])
        
        # Procesar audio
        audio_final = await procesar_audio(texto_tts, voz_seleccionada, duracion_total, duracion_intro, duracion_video_editado)
        
        # Renderizar video final
        video_final = video_final.set_audio(audio_final)
        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp4") as tmp:
            video_final.write_videofile(tmp.name, codec="libx264", fps=24)
            temp_files.append(tmp.name)
            logging.info("Video procesado y guardado temporalmente.")
            return tmp.name
    except Exception as e:
        logging.error(f"Error durante el procesamiento: {e}")
        raise
    finally:
        for file in temp_files:
            try:
                if os.path.exists(file):
                    os.remove(file)
                    logging.info(f"Archivo temporal eliminado: {file}")
            except Exception as e:
                logging.warning(f"No se pudo eliminar el archivo temporal {file}: {e}")

# Interfaz Gradio con ejemplo de uso
with gr.Blocks() as demo:
    gr.Markdown("# Video Editor IA")
    
    with gr.Tab("Principal"):
        video_input = gr.Video(label="Subir video", value=EJEMPLO_VIDEO)  # Video de ejemplo
        texto_tts = gr.Textbox(
            label="Texto para TTS",
            lines=3,
            value="hola esto es una prueba suscribete al canal ya empieza el video"  # Texto de ejemplo
        )
        voz_seleccionada = gr.Dropdown(
            label="Seleccionar voz",
            choices=["es-ES-AlvaroNeural", "es-MX-BeatrizNeural"],
            value="es-ES-AlvaroNeural"
        )
        procesar_btn = gr.Button("Generar Video")
        video_output = gr.Video(label="Resultado")
    
    with gr.Tab("Ajustes"):
        metodo_corte = gr.Radio(
            ["inteligente", "manual"],
            label="Método de cortes",
            value="inteligente"
        )
        duracion_corte = gr.Slider(
            1, 60, 10,
            label="Segundos por corte (solo manual)"
        )

    procesar_btn.click(
        procesar_video,
        inputs=[video_input, texto_tts, voz_seleccionada, metodo_corte, duracion_corte],
        outputs=video_output
    )

if __name__ == "__main__":
    logging.info("Iniciando aplicación Gradio...")
    demo.queue().launch()