Spaces:

archivartaunik
/

SubtitlesBE

Running

App Files Files Community

archivartaunik commited on Mar 10

Commit

f7a8b9d

verified ·

1 Parent(s): ba9fcfd

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -30

app.py CHANGED Viewed

@@ -12,46 +12,40 @@ genai.configure(api_key=GEMINI_API_KEY)
 # Функцыя для транскрыпцыі аўдыя з даданым промптам для стварэння субтытраў з часовымі меткамі
 def transcribe_audio(audio_file):
     try:
-        # Вызначаем mime_type
         mime_type, _ = mimetypes.guess_type(audio_file)
         if mime_type is None:
-            return "Немагчыма вызначыць тып файла.  Падтрымліваюцца толькі аўдыяфайлы."
-        # Загружаем файл
         with open(audio_file, "rb") as f:
             audio_data = f.read()
-        # Дадатковы промпт для стварэння субтытраў з часовымі меткамі
         prompt_text = (
             "зрабі транскрыпцыю аўдыяфайла для стварэння субтытрыў з часовымі меткамі\n"
             "вось прыклад фармату\n"
             "0:00:28.373,0:00:32.347 Нешта маналітнае, цэльнае, а тут чалавек эвалюцыянаваў.\n"
             "0:00:32.898,0:00:37.061 Ды зрабіў круты паварот у сваіх поглядах яшчэ да развалу эсэсэ.\n"
             "0:00:37.901,0:00:41.504 Забываем даражэнькія пра падабайку і падпіску на наш канал, добра."
         )
-        # Ствараем запыт да Gemini з даданнем промпту і audio_data   model = genai.GenerativeModel("gemini-2.0-flash")
         model = genai.GenerativeModel("gemini-2.0-pro-exp-02-05")
         response = model.generate_content(
             [prompt_text, {"mime_type": mime_type, "data": audio_data}]
         )
-        # Атрыманне тэксту транскрыпцыі (які ўжо змяшчае часовыя меткі)
         if response.text:
             transcript = response.text.strip()
         else:
-            transcript = "Не атрымалася транскрыбаваць аўдыя.  Магчыма, памылка з API."
         return transcript
     except FileNotFoundError:
         return "Памылка: Файл не знойдзены."
     except genai.APIError as e:
-        return f"Памылка API : {str(e)}"
     except Exception as e:
         return f"Нечаканая памылка: {str(e)}"
-# Функцыя для стварэння SRT-файла, у якім субтытры ўжо змяшчаюць часовыя меткі
 def create_srt(transcript):
     srt_path = "subtitles.srt"
     try:
@@ -61,29 +55,26 @@ def create_srt(transcript):
     except Exception as e:
         return f"Памылка пры запісе SRT-файла: {str(e)}", None
 # Функцыя для апрацоўкі аўдыя
 def process_audio(audio):
     transcript = transcribe_audio(audio)
     if transcript.startswith("Памылка"):
-        return transcript, None  # Вяртаем паведамленне пра памылку і None для SRT-файла
     text, srt_file = create_srt(transcript)
     return text, srt_file
-# Gradio інтэрфейс
-iface = gr.Interface(
-    fn=process_audio,
-    inputs=gr.Audio(type="filepath"),
-    outputs=[gr.Textbox(label="Транскрыпцыя"), gr.File(label="SRT-файл")],
-    title="Транскрыпцыя аўдыя для беларускай мовы",
-    description="""
-                ## Стварэнне субтытраў для беларускай мовы
-                Загрузіце аўд��ёфайл, і субтытры будуць аўтаматычна згенераваны разам з файлам для юцюба, які можна адразу імпартаваць. Падтрымліваюцца фарматы WAV, MP3.
-                [Далучайцеся да беларускаймоўнай суполкі ў ТГ](https://t.me/belarusai)
-                **Падтрымаць праект:** [Buy me a coffee](https://buymeacoffee.com/tuteishygpt)
-                """
-)
-if __name__ == "__main__":
-    iface.launch()

 # Функцыя для транскрыпцыі аўдыя з даданым промптам для стварэння субтытраў з часовымі меткамі
 def transcribe_audio(audio_file):
     try:
         mime_type, _ = mimetypes.guess_type(audio_file)
         if mime_type is None:
+            return "Немагчыма вызначыць тып файла. Падтрымліваюцца толькі аўдыяфайлы."
         with open(audio_file, "rb") as f:
             audio_data = f.read()
         prompt_text = (
             "зрабі транскрыпцыю аўдыяфайла для стварэння субтытрыў з часовымі меткамі\n"
             "вось прыклад фармату\n"
             "0:00:28.373,0:00:32.347 Нешта маналітнае, цэльнае, а тут чалавек эвалюцыянаваў.\n"
             "0:00:32.898,0:00:37.061 Ды зрабіў круты паварот у сваіх поглядах яшчэ да развалу эсэсэ.\n"
             "0:00:37.901,0:00:41.504 Забываем даражэнькія пра падабайку і падпіску на наш канал, добра."
+            "не пішы нічога, акрамя транскрыпцыі ў зададзеным фармаце"
         )
         model = genai.GenerativeModel("gemini-2.0-pro-exp-02-05")
         response = model.generate_content(
             [prompt_text, {"mime_type": mime_type, "data": audio_data}]
         )
         if response.text:
             transcript = response.text.strip()
         else:
+            transcript = "Не атрымалася транскрыбаваць аўдыя. Магчыма, памылка з API."
         return transcript
     except FileNotFoundError:
         return "Памылка: Файл не знойдзены."
     except genai.APIError as e:
+        return f"Памылка API: {str(e)}"
     except Exception as e:
         return f"Нечаканая памылка: {str(e)}"
+# Функцыя для стварэння SRT-файла з субтытрамі
 def create_srt(transcript):
     srt_path = "subtitles.srt"
     try:
     except Exception as e:
         return f"Памылка пры запісе SRT-файла: {str(e)}", None
 # Функцыя для апрацоўкі аўдыя
 def process_audio(audio):
     transcript = transcribe_audio(audio)
     if transcript.startswith("Памылка"):
+        return transcript, None
     text, srt_file = create_srt(transcript)
     return text, srt_file
+# Выкарыстанне gr.Blocks для стварэння інтэрфейсу з вертыкальным размяшчэннем
+with gr.Blocks() as demo:
+    gr.Markdown("# Транскрыпцыя аўдыя для беларускай мовы")
+    gr.Markdown("### Загрузіце аўдыёфайл і атрымаеце транскрыпцыю разам з SRT-файлам")
+    audio_input = gr.Audio(type="filepath", label="Аўдыёфайл")
+    # Кампаненты размешчаны адзін пад адным
+    transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
+    file_output = gr.File(label="SRT-файл")
+    btn = gr.Button("Апрацаваць")
+    btn.click(process_audio, inputs=audio_input, outputs=[transcript_output, file_output])
+demo.launch()