Spaces:

Delik
/

pyannote-speaker-diarization-3.1

Running on Zero

Update app.py

f364821 verified 11 months ago

1.1 kB

	import gradio as gr
	import os
	import torch
	import io
	import wavio
	from pyannote.audio import Pipeline
	from pyannote.audio import Audio
	from pyannote.core import Segment

	pipeline = Pipeline.from_pretrained(
	"pyannote/speaker-diarization-3.1",
	use_auth_token=os.environ['api'])

	def process_audio(audio):
	# Extract the audio data and sample rate from the tuple
	audio_data, sample_rate = audio

	# Save the uploaded audio file to a temporary location
	with wavio.open("temp.wav", "w", rate=sample_rate, channels=1, sampwidth=2) as wav:
	wav.write(audio_data)

	# Use the diarization pipeline to process the audio
	diarization = pipeline("temp.wav")

	# Remove the temporary file
	os.remove("temp.wav")

	# Return the diarization output
	return diarization

	with gr.Blocks() as demo:
	audio_input = gr.Audio(label="Upload Audio")
	process_button = gr.Button("Process")
	diarization_output = gr.JSON(label="Diarization Output")

	process_button.click(fn=process_audio, inputs=audio_input, outputs=diarization_output)

	demo.launch()