Spaces:

archivartaunik
/

SubtitlesBE

Running

App Files Files Community

archivartaunik commited on Mar 10

Commit

d9d75ab

verified ·

1 Parent(s): a4cbcc8

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -15

app.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import os
 import gradio as gr
 import google.generativeai as genai
 # Атрымаем токен з асяроддзя (Secrets у Hugging Face)
 GEMINI_API_KEY = os.getenv("gemini")
@@ -11,6 +12,11 @@ genai.configure(api_key=GEMINI_API_KEY)
 # Функцыя для транскрыпцыі аўдыя з даданым промптам для стварэння субтытраў з часовымі меткамі
 def transcribe_audio(audio_file):
     try:
         # Загружаем файл
         with open(audio_file, "rb") as f:
             audio_data = f.read()
@@ -24,43 +30,55 @@ def transcribe_audio(audio_file):
             "0:00:37.901,0:00:41.504 Забываем даражэнькія пра падабайку і падпіску на наш канал, добра."
         )
-        # Ствараем запыт да Gemini 2.0 Flash з даданнем промпту
-        model = genai.GenerativeModel("gemini-2.0-flash-thinking-exp-01-21")
         response = model.generate_content(
-            [audio_data],
-            request_options={
-                "mime_type": "audio/wav",
-                "prompt": prompt_text
-            }
         )
         # Атрыманне тэксту транскрыпцыі (які ўжо змяшчае часовыя меткі)
-        transcript = response.text.strip() if response.text else "Не атрымалася транскрыбаваць аўдыя."
         return transcript
     except Exception as e:
-        return f"Памылка: {str(e)}"
 # Функцыя для стварэння SRT-файла, у якім субтытры ўжо змяшчаюць часовыя меткі
 def create_srt(transcript):
     srt_path = "subtitles.srt"
-    with open(srt_path, "w", encoding="utf-8") as f:
-        f.write(transcript)
-    return transcript, srt_path
 # Функцыя для апрацоўкі аўдыя
 def process_audio(audio):
     transcript = transcribe_audio(audio)
     text, srt_file = create_srt(transcript)
     return text, srt_file
 # Gradio інтэрфейс
 iface = gr.Interface(
     fn=process_audio,
     inputs=gr.Audio(type="filepath"),
     outputs=[gr.Textbox(label="Транскрыпцыя"), gr.File(label="SRT-файл")],
-    title="Транскрыпцыя аўдыя з Gemini 2.0",
-    description="Загрузіце аўдыяфайл, і мадэль Gemini 2.0 Flash створыць субтытры з часовымі меткамі."
 )
 if __name__ == "__main__":
-    iface.launch()

 import os
 import gradio as gr
 import google.generativeai as genai
+import mimetypes
 # Атрымаем токен з асяроддзя (Secrets у Hugging Face)
 GEMINI_API_KEY = os.getenv("gemini")
 # Функцыя для транскрыпцыі аўдыя з даданым промптам для стварэння субтытраў з часовымі меткамі
 def transcribe_audio(audio_file):
     try:
+        # Вызначаем mime_type
+        mime_type, _ = mimetypes.guess_type(audio_file)
+        if mime_type is None:
+            return "Немагчыма вызначыць тып файла.  Падтрымліваюцца толькі аўдыяфайлы."
         # Загружаем файл
         with open(audio_file, "rb") as f:
             audio_data = f.read()
             "0:00:37.901,0:00:41.504 Забываем даражэнькія пра падабайку і падпіску на наш канал, добра."
         )
+        # Ствараем запыт да Gemini з даданнем промпту і audio_data
+        model = genai.GenerativeModel("gemini-1.5-flash")
         response = model.generate_content(
+            [prompt_text, {"mime_type": mime_type, "data": audio_data}]
         )
         # Атрыманне тэксту транскрыпцыі (які ўжо змяшчае часовыя меткі)
+        if response.text:
+            transcript = response.text.strip()
+        else:
+            transcript = "Не атрымалася транскрыбаваць аўдыя.  Магчыма, памылка з API."
         return transcript
+    except FileNotFoundError:
+        return "Памылка: Файл не знойдзены."
+    except genai.APIError as e:
+        return f"Памылка API Gemini: {str(e)}"
     except Exception as e:
+        return f"Нечаканая памылка: {str(e)}"
 # Функцыя для стварэння SRT-файла, у якім субтытры ўжо змяшчаюць часовыя меткі
 def create_srt(transcript):
     srt_path = "subtitles.srt"
+    try:
+        with open(srt_path, "w", encoding="utf-8") as f:
+            f.write(transcript)
+        return transcript, srt_path
+    except Exception as e:
+        return f"Памылка пры запісе SRT-файла: {str(e)}", None
 # Функцыя для апрацоўкі аўдыя
 def process_audio(audio):
     transcript = transcribe_audio(audio)
+    if transcript.startswith("Памылка"):
+        return transcript, None  # Вяртаем паведамленне пра памылку і None для SRT-файла
     text, srt_file = create_srt(transcript)
     return text, srt_file
 # Gradio інтэрфейс
 iface = gr.Interface(
     fn=process_audio,
     inputs=gr.Audio(type="filepath"),
     outputs=[gr.Textbox(label="Транскрыпцыя"), gr.File(label="SRT-файл")],
+    title="Транскрыпцыя аўдыя з Gemini",
+    description="Загрузіце аўдыяфайл, і мадэль Gemini створыць субтытры з часовымі меткамі."
 )
 if __name__ == "__main__":
+    iface.launch()