xaman4

Running

salomonsky commited on Jan 24, 2024

Commit

0a1e8c2

verified ·

1 Parent(s): b792247

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,6 @@
 import io
 import base64
 import webrtcvad
 import threading
 import numpy as np
@@ -9,6 +10,19 @@ import sounddevice as sd
 import speech_recognition as sr
 from huggingface_hub import InferenceClient
 devices = sd.query_devices()
 print(devices)
@@ -127,6 +141,15 @@ class Threader(threading.Thread):
             print("Started mythread")
             start_stream()
 if __name__ == "__main__":
     vad = webrtcvad.Vad(1)
@@ -140,10 +163,4 @@ if __name__ == "__main__":
     block_size = int(sample_rate * interval_size / 1000)
     Threader(name='mythread')
-    st.button("Detener Stream")
-    st.text("Esperando entrada de voz...")
-    st.text("Puedes detener el stream manualmente usando el botón 'Detener Stream'.")
-    st.text("Nota: El código actual imprime los resultados de VAD en la consola.")
-    st.text("Puedes personalizar la lógica de VAD según tus necesidades.")
-    st.text("La transcripción de voz y la generación de texto se manejarán una vez que se detecte actividad de voz.")
-    st.text("Inicia la grabación y espera a que aparezcan los resultados.")

 import io
 import base64
+import pyaudio
 import webrtcvad
 import threading
 import numpy as np
 import speech_recognition as sr
 from huggingface_hub import InferenceClient
+def list_audio_devices():
+    p = pyaudio.PyAudio()
+    info = p.get_host_api_info_by_index(0)
+    num_devices = info.get('deviceCount')
+    devices = []
+    for i in range(num_devices):
+        device_info = p.get_device_info_by_host_api_device_index(0, i)
+        devices.append(device_info['name'])
+    p.terminate()
+    return devices
 devices = sd.query_devices()
 print(devices)
             print("Started mythread")
             start_stream()
+available_audio_devices = list_audio_devices()
+print("Dispositivos de audio disponibles:")
+print(available_audio_devices)
+selected_device = st.selectbox("Selecciona el micrófono:", available_audio_devices, index=0)
+channels = [1]
+mapping = [c - 1 for c in channels]
+device_info = sd.query_devices(selected_device, 'input')
+sample_rate = int(device_info['default_samplerate'])
 if __name__ == "__main__":
     vad = webrtcvad.Vad(1)
     block_size = int(sample_rate * interval_size / 1000)
     Threader(name='mythread')
+    st.button("Detener Stream")