File size: 947 Bytes
bb25137 ab01055 bb25137 ab01055 bb25137 ab01055 bb25137 ab01055 bb25137 ab01055 bb25137 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
import gradio as gr
import numpy as np
import librosa
from transformers import pipeline
# Cargar el modelo de transcripci贸n Whisper
transcriber = pipeline("automatic-speech-recognition", model="openai/whisper-small")
# Funci贸n para procesar y transcribir el audio
def transcribe(audio):
if audio is None:
raise ValueError("No se ha proporcionado un archivo de audio.")
# Cargar el archivo de audio como un array NumPy
audio_data, _ = librosa.load(audio, sr=16000) # Resample a 16 kHz
result = transcriber(np.array(audio_data))
return result["text"]
# Crear la interfaz Gradio
demo = gr.Interface(
fn=transcribe,
inputs=gr.Audio(type="filepath"), # Subida de archivos de audio
outputs="text",
title="Transcripci贸n de Audio en Vivo",
description="Sube un archivo de audio para transcribir su contenido autom谩ticamente."
)
# Lanzar la aplicaci贸n
if __name__ == "__main__":
demo.launch() |