Spaces:

Mohssinibra
/

speakerDiarization

Running

Mohssinibra commited on Feb 14

Commit

6163755

verified ·

1 Parent(s): ec8a5e6

distinct

Files changed (1) hide show

app.py CHANGED Viewed

@@ -32,11 +32,20 @@ def process_audio(audio_path):
         mfccs_scaled = scaler.fit_transform(mfccs.T)
         print("MFCC normalisé.")
-        # Clustering avec KMeans
         kmeans = KMeans(n_clusters=2, random_state=42, n_init=10)
         speaker_labels = kmeans.fit_predict(mfccs_scaled)
         print(f"Clustering terminé, {len(set(speaker_labels))} locuteurs détectés.")
         # Regrouper les segments audio par speaker
         speaker_audio = {speaker: [] for speaker in set(speaker_labels)}
         segment_duration = len(audio_denoised) // len(speaker_labels)

         mfccs_scaled = scaler.fit_transform(mfccs.T)
         print("MFCC normalisé.")
+        # Clustering avec KMeans (au départ avec 2 clusters, mais on peut ajuster après)
         kmeans = KMeans(n_clusters=2, random_state=42, n_init=10)
         speaker_labels = kmeans.fit_predict(mfccs_scaled)
         print(f"Clustering terminé, {len(set(speaker_labels))} locuteurs détectés.")
+        # Vérification du nombre de locuteurs
+        num_speakers = len(set(speaker_labels))
+        if num_speakers == 1:
+            print("Un seul locuteur détecté.")
+        elif num_speakers == 2:
+            print("Deux locuteurs détectés.")
+        else:
+            print(f"Plus de deux locuteurs détectés : {num_speakers} locuteurs.")
         # Regrouper les segments audio par speaker
         speaker_audio = {speaker: [] for speaker in set(speaker_labels)}
         segment_duration = len(audio_denoised) // len(speaker_labels)