Spaces:

archivartaunik
/

SubtitlesBE

Running

App Files Files Community

archivartaunik commited on Mar 12

Commit

9dab23b

verified ·

1 Parent(s): 776e8e7

Update app.py

Browse files

Files changed (1) hide show

app.py +70 -41

app.py CHANGED Viewed

@@ -2,14 +2,13 @@ import os
 import gradio as gr
 import google.generativeai as genai
 import mimetypes
-# Атрымаем токен з асяроддзя (Secrets у Hugging Face)
 GEMINI_API_KEY = os.getenv("gemini2")
-# Ініцыялізуем кліент Google Generative AI
 genai.configure(api_key=GEMINI_API_KEY)
-# Функцыя для транскрыпцыі аўдыя з даданым промптам для стварэння субтытраў з часовымі меткамі
 def transcribe_audio(audio_file):
     try:
         mime_type, _ = mimetypes.guess_type(audio_file)
@@ -17,36 +16,31 @@ def transcribe_audio(audio_file):
             return "Немагчыма вызначыць тып файла. Падтрымліваюцца толькі аўдыяфайлы."
         with open(audio_file, "rb") as f:
             audio_data = f.read()
         prompt_text = (
             """зрабі транскрыпцыю аўдыяфайла для стварэння субтытрыў з часовымі меткамі srt
-            не пішы нічога, акрамя транскрыпцыі ў зададзеным фармаце, вось прыклад фармату
-                1
-                00:00:00,659 --> 00:00:03,019
-                Вольга Гапеева. Camel Travel.
-                2
-                00:00:03,699 --> 00:00:09,500
-                Раман. Чытае Уладзімір Лісоўскі.Глава першая.
-                3
-                00:00:10,719 --> 00:00:15,079
-                Ісык-Куль.Паважаныя пасажыры!
-                4
-                00:00:15,619 --> 00:00:19,100
-                Наш самалёт прызямліўся ў
-                горадзе-героі Фрунзэ.
-        """
         )
-        model = genai.GenerativeModel("gemini-2.0-pro-exp-02-05")
         response = model.generate_content(
             [prompt_text, {"mime_type": mime_type, "data": audio_data}]
         )
         if response.text:
             transcript = response.text.strip()
         else:
@@ -59,7 +53,6 @@ def transcribe_audio(audio_file):
     except Exception as e:
         return f"Нечаканая памылка: {str(e)}"
-# Функцыя для стварэння SRT-файла з субтытрамі
 def create_srt(transcript):
     srt_path = "subtitles.srt"
     try:
@@ -69,7 +62,6 @@ def create_srt(transcript):
     except Exception as e:
         return f"Памылка пры запісе SRT-файла: {str(e)}", None
-# Функцыя для апрацоўкі аўдыя
 def process_audio(audio):
     transcript = transcribe_audio(audio)
     if transcript.startswith("Памылка"):
@@ -77,22 +69,59 @@ def process_audio(audio):
     text, srt_file = create_srt(transcript)
     return text, srt_file
-# Выкарыстанне gr.Blocks для стварэння інтэрфейсу з вертыкальным размяшчэннем
 with gr.Blocks() as demo:
     gr.Markdown("# Транскрыпцыя аў��ыя для беларускай мовы")
-    gr.Markdown("""
-                ##  Загрузіце аўдыёфайл, і субтытры будуць аўтаматычна згенераваны разам з файлам субтытраў.
-                [Далучайцеся да беларускаймоўнай суполкі ў ТГ](https://t.me/belarusai)
-                **Падтрымаць праект:** [Buy me a coffee](https://buymeacoffee.com/tuteishygpt)
-                """)
-    audio_input = gr.Audio(type="filepath", label="Аўдыёфайл")
     btn = gr.Button("Апрацаваць")
     transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
     file_output = gr.File(label="SRT-файл")
-    btn.click(process_audio, inputs=audio_input, outputs=[transcript_output, file_output])
 demo.launch()

 import gradio as gr
 import google.generativeai as genai
 import mimetypes
+import moviepy.editor as mp
 GEMINI_API_KEY = os.getenv("gemini2")
+MODEL_NAME = os.getenv("mod")
 genai.configure(api_key=GEMINI_API_KEY)
 def transcribe_audio(audio_file):
     try:
         mime_type, _ = mimetypes.guess_type(audio_file)
             return "Немагчыма вызначыць тып файла. Падтрымліваюцца толькі аўдыяфайлы."
         with open(audio_file, "rb") as f:
             audio_data = f.read()
         prompt_text = (
             """зрабі транскрыпцыю аўдыяфайла для стварэння субтытрыў з часовымі меткамі srt
+не пішы нічога, акрамя транскрыпцыі ў зададзеным фармаце, вось прыклад фармату
+    1
+    00:00:00,659 --> 00:00:03,019
+    Вольга Гапеева. Camel Travel.
+    2
+    00:00:03,699 --> 00:00:09,500
+    Раман. Чытае Уладзімір Лісоўскі. Глава першая.
+    3
+    00:00:10,719 --> 00:00:15,079
+    Ісык-Куль. Паважаныя пасажыры!
+    4
+    00:00:15,619 --> 00:00:19,100
+    Наш самалёт прызямліўся ў
+    горадзе-героі Фрунзэ.
+            """
         )
+        model = genai.GenerativeModel(MODEL_NAME)
         response = model.generate_content(
             [prompt_text, {"mime_type": mime_type, "data": audio_data}]
         )
         if response.text:
             transcript = response.text.strip()
         else:
     except Exception as e:
         return f"Нечаканая памылка: {str(e)}"
 def create_srt(transcript):
     srt_path = "subtitles.srt"
     try:
     except Exception as e:
         return f"Памылка пры запісе SRT-файла: {str(e)}", None
 def process_audio(audio):
     transcript = transcribe_audio(audio)
     if transcript.startswith("Памылка"):
     text, srt_file = create_srt(transcript)
     return text, srt_file
+def extract_audio_from_video(video_file):
+    try:
+        clip = mp.VideoFileClip(video_file)
+        audio_path = "extracted_audio.wav"
+        clip.audio.write_audiofile(audio_path, logger=None)
+        return audio_path, None
+    except Exception as e:
+        return None, f"Памылка пры выдзяленні аўдыі з відэафайла: {str(e)}"
+def process_video(video):
+    audio_path, error = extract_audio_from_video(video)
+    if error:
+        return error, None
+    return process_audio(audio_path)
+def process_file(audio, video):
+    if audio is not None:
+        return process_audio(audio)
+    elif video is not None:
+        return process_video(video)
+    else:
+        return "Няма файла для апрацоўкі.", None
+def update_on_audio_change(audio):
+    if audio is not None:
+        return gr.update(value=None, interactive=False)
+    else:
+        return gr.update(interactive=True)
+def update_on_video_change(video):
+    if video is not None:
+        return gr.update(value=None, interactive=False)
+    else:
+        return gr.update(interactive=True)
 with gr.Blocks() as demo:
     gr.Markdown("# Транскрыпцыя аў��ыя для беларускай мовы")
+    gr.Markdown(
+        """
+## Загрузіце аўдыёфайл або відэафайл. Калі загружаны аўдыёфайл, відэа неактыўна, і наадварот.
+Субтытры будуць аўтаматычна згенераваны разам з файлам субтытраў.
+[Далучайцеся да беларускаймоўнай суполкі ў ТГ](https://t.me/belarusai)
+**Падтрымаць праект:** [Buy me a coffee](https://buymeacoffee.com/tuteishygpt)
+        """
+    )
+    with gr.Row():
+        audio_input = gr.Audio(type="filepath", label="Аўдыёфайл")
+        video_input = gr.Video(type="filepath", label="Відэафайл")
+    audio_input.change(fn=update_on_audio_change, inputs=audio_input, outputs=video_input)
+    video_input.change(fn=update_on_video_change, inputs=video_input, outputs=audio_input)
     btn = gr.Button("Апрацаваць")
     transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
     file_output = gr.File(label="SRT-файл")
+    btn.click(fn=process_file, inputs=[audio_input, video_input], outputs=[transcript_output, file_output])
 demo.launch()