import gradio as gr | |
import numpy as np | |
import librosa | |
from transformers import pipeline | |
# Cargar el modelo de transcripci贸n Whisper | |
transcriber = pipeline("automatic-speech-recognition", model="openai/whisper-small") | |
# Funci贸n para procesar y transcribir el audio | |
def transcribe(audio): | |
if audio is None: | |
raise ValueError("No se ha proporcionado un archivo de audio.") | |
# Cargar el archivo de audio como un array NumPy | |
audio_data, _ = librosa.load(audio, sr=16000) # Resample a 16 kHz | |
result = transcriber(np.array(audio_data)) | |
return result["text"] | |
# Crear la interfaz Gradio | |
demo = gr.Interface( | |
fn=transcribe, | |
inputs=gr.Audio(type="filepath"), # Subida de archivos de audio | |
outputs="text", | |
title="Transcripci贸n de Audio en Vivo", | |
description="Sube un archivo de audio para transcribir su contenido autom谩ticamente." | |
) | |
# Lanzar la aplicaci贸n | |
if __name__ == "__main__": | |
demo.launch() |