File size: 947 Bytes
bb25137
ab01055
 
bb25137
 
 
 
 
ab01055
bb25137
ab01055
 
 
 
 
 
bb25137
 
ab01055
bb25137
 
ab01055
bb25137
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import gradio as gr
import numpy as np
import librosa
from transformers import pipeline

# Cargar el modelo de transcripci贸n Whisper
transcriber = pipeline("automatic-speech-recognition", model="openai/whisper-small")

# Funci贸n para procesar y transcribir el audio
def transcribe(audio):
    if audio is None:
        raise ValueError("No se ha proporcionado un archivo de audio.")

    # Cargar el archivo de audio como un array NumPy
    audio_data, _ = librosa.load(audio, sr=16000)  # Resample a 16 kHz
    result = transcriber(np.array(audio_data))
    return result["text"]

# Crear la interfaz Gradio
demo = gr.Interface(
    fn=transcribe,
    inputs=gr.Audio(type="filepath"),  # Subida de archivos de audio
    outputs="text",
    title="Transcripci贸n de Audio en Vivo",
    description="Sube un archivo de audio para transcribir su contenido autom谩ticamente."
)

# Lanzar la aplicaci贸n
if __name__ == "__main__":
    demo.launch()