xaman4

Sleeping

salomonsky commited on Jan 16, 2024

Commit

64b204a

verified ·

1 Parent(s): 9a19970

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,12 +4,7 @@ import io
 from huggingface_hub import InferenceClient
 from gtts import gTTS
 import speech_recognition as sr
-from streamlit_webrtc import webrtc_streamer, VideoTransformerBase
-class AudioTransformer(VideoTransformerBase):
-    def transform(self, frame):
-        audio_data = frame.to_ndarray(format="int16")
-        return audio_data
 def recognize_speech(audio_data, show_messages=True):
     recognizer = sr.Recognizer()
@@ -72,17 +67,10 @@ def main():
     if "history" not in st.session_state:
         st.session_state.history = []
-    audio_transformer = AudioTransformer()
-    webrtc_ctx = webrtc_streamer(
-        key="audio-recorder",
-        audio_transformer_factory=audio_transformer,
-        async_transform=True,
-    )
-    if webrtc_ctx.audio_processor:
-        audio_data = webrtc_ctx.audio_processor.get_frames()
-        audio_text = recognize_speech(audio_data)
         if not st.session_state.history:
             pre_prompt = "Te Llamarás Chaman 4.0 y tus respuestas serán sumamente breves."
@@ -104,4 +92,4 @@ def main():
                 )
 if __name__ == "__main__":
-    main()

 from huggingface_hub import InferenceClient
 from gtts import gTTS
 import speech_recognition as sr
+from streamlit_audiorecorder import st_audiorecorder
 def recognize_speech(audio_data, show_messages=True):
     recognizer = sr.Recognizer()
     if "history" not in st.session_state:
         st.session_state.history = []
+    audio_bytes = st_audiorecorder()
+    if audio_bytes is not None:
+        st.audio(audio_bytes, format="audio/wav")
         if not st.session_state.history:
             pre_prompt = "Te Llamarás Chaman 4.0 y tus respuestas serán sumamente breves."
                 )
 if __name__ == "__main__":
+    main()