Spaces:

jdalfonso
/

SISE-ULTIMATE-CHALLENGE

Sleeping

Falonne Kpamegan

base code

730469b 4 months ago

1.01 kB

	import torch
	from transformers import Wav2Vec2Processor
	from model import Wav2Vec2EmotionClassifier
	import librosa

	# Charger le modèle et le processeur
	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-large-xlsr-53")
	model = Wav2Vec2EmotionClassifier()
	model.load_state_dict(torch.load("wav2vec2_emotion.pth"))
	model.to(device)
	model.eval()

	emotion_labels = ["joie", "colère", "neutre"]

	def predict_emotion(audio_path):
	waveform, _ = librosa.load(audio_path, sr=16000)
	input_values = processor(waveform, return_tensors="pt", sampling_rate=16000).input_values
	input_values = input_values.to(device)

	with torch.no_grad():
	outputs = model(input_values)

	predicted_label = torch.argmax(outputs, dim=1).item()
	return emotion_labels[predicted_label]

	# Exemple d'utilisation
	audio_test = "data/audio1.wav"
	emotion = predict_emotion(audio_test)
	print(f"Émotion détectée : {emotion}")