Spaces:

archivartaunik
/

SubtitlesBE

Running

App Files Files Community

archivartaunik commited on Mar 18

Commit

265d4cc

verified ·

1 Parent(s): a7ebd79

Update app.py

Browse files

Files changed (1) hide show

app.py +112 -90

app.py CHANGED Viewed

@@ -7,132 +7,145 @@ from pydub import AudioSegment
 # Атрыманне ключоў і мадэляў з пераменных асяроддзя
 GEMINI_API_KEY = os.getenv("gemini")
-MODEL_NAME_TH = os.getenv("modTH")
-MODEL_NAME = os.getenv("mod")
-P = os.getenv("p")
-# Стварэнне кліента з новым SDK
-client = genai.Client(api_key=GEMINI_API_KEY)
-def transcribe_audio(audio_file):
     try:
         mime_type, _ = mimetypes.guess_type(audio_file)
-        if mime_type is None or not mime_type.startswith("audio"):  # Правяраем, што гэта аўдыяфайл
-            return "Немагчыма вызначыць тып файла або файл не з'яўляецца аўдыяфайлам. Падтрымліваюцца толькі аўдыяфайлы."
         with open(audio_file, "rb") as f:
             audio_data = f.read()
-        prompt_text = P  #  P хутчэй за ўсё ўтрымлівае промт для транскрыпцыі
-        response = client.models.generate_content(
-            model=MODEL_NAME_TH,
-            contents=[prompt_text, {"mime_type": mime_type, "data": audio_data}],
-            generation_config=types.GenerationConfig()   #  Выкарыстоўваем правільны клас GenerationConfig
         )
-        if response.text:
-            transcript = response.text.strip()
-        else:
-            transcript = "Не атрымалася транскрыбаваць аўдыя. Магчыма, памылка з API."
-        return transcript
     except FileNotFoundError:
         return "Памылка: Файл не знойдзены."
     except Exception as e:
-        return f"Нечаканая памылка: {str(e)}"
-def fix_subtitles_format(transcript):
-    """
-    Дадатковы запыт да мадэлі, які выпраўляе фармат часоў у субцітрах.
-    """
     try:
-        prompt_fix = (
-            f"Не змяняй тэксты, выправі толькі часовы фармат у субцітрах на правільны, вось прыклад 00:00:01,589 \n"
-            f"У адказ напішы толькі субцітры: {transcript}"
-        )
-        response_fix = client.models.generate_content(
-            model=MODEL_NAME,
-            contents=prompt_fix,
-            generation_config=types.GenerationConfig() # Выкарыстоўваем правільны клас
-        )
-        if response_fix.text:
-            fixed_transcript = response_fix.text.strip()
-        else:
-            fixed_transcript = transcript # Калі памылка, вяртаем зыходны транскрыпт
-        return fixed_transcript
     except Exception as e:
-        return transcript  # Калі памылка, вяртаем зыходны транскрыпт
-def create_srt(transcript, filename="subtitles.srt"):
     try:
         with open(filename, "w", encoding="utf-8") as f:
             f.write(transcript)
         return transcript, filename
     except Exception as e:
-        return f"Памылка пры запісе SRT-файла: {str(e)}", None
-def process_audio(audio):
-    transcript = transcribe_audio(audio)
-    if transcript.startswith("Памылка") or transcript.startswith("Немагчыма"): # Больш поўная праверка памылак
-        return transcript, None
-    # Выпраўляем фармат часу ў субцітрах
     fixed_transcript = fix_subtitles_format(transcript)
     text, srt_file = create_srt(fixed_transcript)
     return text, srt_file
-def extract_audio_from_video(video_file):
     try:
         audio = AudioSegment.from_file(video_file)
         audio_path = "extracted_audio.mp3"
         audio.export(audio_path, format="mp3")
-        return audio_path, None
     except Exception as e:
-        return None, f"Памылка пры выдзяленні аўдыі з відэафайла: {str(e)}"
-def process_video(video):
-    audio_path, error = extract_audio_from_video(video)
     if error:
-        return error, None
     return process_audio(audio_path)
-def process_file(audio, video):
-    if audio is not None:
-        return process_audio(audio)
-    elif video is not None:
-        return process_video(video)
-    else:
-        return "Няма файла для апрацоўкі.", None
-def update_on_audio_change(audio):
-    if audio is not None:
-        return gr.update(value=None, interactive=False)
     else:
-        return gr.update(interactive=True)
-def update_on_video_change(video):
-    if video is not None:
-        return gr.update(value=None, interactive=False)
-    else:
-        return gr.update(interactive=True)
-def translate_transcript(transcript, target_language):
     try:
-        prompt_text = (
-            f"перакладзі толькі тэксты субцітраў на {target_language} мову. Астатня пакінь як ёсць.\n"
-            f"Тэкст:\n{transcript}"
-        )
-        response = client.models.generate_content(
-            model=MODEL_NAME,
-            contents=prompt_text,
-            generation_config=types.GenerationConfig() # Выкары��тоўваем правільны клас
-        )
-        if response.text:
-            translated = response.text.strip()
-        else:
-            translated = "Не атрымалася перакласці тэкст. Магчыма, памылка з API."
         translated_srt_filename = "translated_subtitles.srt"
-        with open(translated_srt_filename, "w", encoding="utf-8") as f:
-            f.write(translated)
-        return translated, translated_srt_filename
     except Exception as e:
-        return f"Памылка пры перакладзе: {str(e)}", None
 with gr.Blocks() as demo:
     gr.Markdown("# Транскрыпцыя аўдыя для беларускай мовы")
@@ -147,19 +160,28 @@ with gr.Blocks() as demo:
     with gr.Row():
         audio_input = gr.Audio(type="filepath", label="Аўдыёфайл")
         video_input = gr.Video(label="Відэафайл")
-    audio_input.change(fn=update_on_audio_change, inputs=audio_input, outputs=video_input)
-    video_input.change(fn=update_on_video_change, inputs=video_input, outputs=audio_input)
     btn = gr.Button("Апрацаваць")
     transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
     file_output = gr.File(label="SRT-файл")
-    btn.click(fn=process_file, inputs=[audio_input, video_input], outputs=[transcript_output, file_output])
     gr.Markdown("## Пераклад субцітраў")
     with gr.Row():
         language_dropdown = gr.Dropdown(
             choices=["English", "Руcкая", "Польская", "Літоўская", "Нямецкая"],
-            label="Выберы мову перакладу", value="English"
         )
         translate_btn = gr.Button("Пераклад")
     translation_output = gr.Textbox(label="Пераклад", lines=10)
@@ -167,7 +189,7 @@ with gr.Blocks() as demo:
     translate_btn.click(
         fn=translate_transcript,
         inputs=[transcript_output, language_dropdown],
-        outputs=[translation_output, translation_file_output]
     )
 demo.launch()

 # Атрыманне ключоў і мадэляў з пераменных асяроддзя
 GEMINI_API_KEY = os.getenv("gemini")
+MODEL_NAME_TH = os.getenv("modTH")  # Мадэль для транскрыпцыі
+MODEL_NAME = os.getenv(
+    "mod"
+)  # Мадэль для выпраўлення фармату і перакладу (можа быць той жа, што і modTH)
+PROMPT_TRANSCRIBE = os.getenv(
+    "p"
+)  # Промпт для транскрыпцыі (лепш мець зразумелае імя)
+# Стварэнне кліента (больш просты спосаб)
+client = genai.GenerativeModel(model_name=MODEL_NAME_TH, api_key=GEMINI_API_KEY)
+client_general = genai.GenerativeModel(model_name=MODEL_NAME, api_key=GEMINI_API_KEY)
+def transcribe_audio(audio_file: str) -> str:
+    """Транскрыбуе аўдыяфайл з дапамогай Google GenAI."""
     try:
         mime_type, _ = mimetypes.guess_type(audio_file)
+        if not mime_type or not mime_type.startswith("audio"):
+            return (
+                "Немагчыма вызначыць тып файла або файл не з'яўляецца аўдыяфайлам. "
+                "Падтрымліваюцца толькі аўдыяфайлы."
+            )
         with open(audio_file, "rb") as f:
             audio_data = f.read()
+        response = client.generate_content(
+            [
+                PROMPT_TRANSCRIBE,
+                {"mime_type": mime_type, "data": audio_data},
+            ]  # ,  # Промпт + дадзеныя
+            # generation_config=types.GenerationConfig( # можна задаць дадатковыя параметры, напр. temperature
+            #     temperature=0.2,
+            # )
         )
+        response.resolve()  #  Яўнае дазвол прамісаў (калі выкарыстоўваецца асінхронны рэжым)
+        return response.text.strip()
     except FileNotFoundError:
         return "Памылка: Файл не знойдзены."
     except Exception as e:
+        return f"Нечаканая памылка: {e}"
+def fix_subtitles_format(transcript: str) -> str:
+    """Выпраўляе фармат часу ў субцітрах."""
+    prompt_fix = (
+        "Не змяняй тэксты, выправі толькі часовы фармат у субцітрах на правільны, "
+        "вось прыклад 00:00:01,589. \nУ адказ напішы толькі субцітры:\n"
+        f"{transcript}"
+    )
     try:
+        response_fix = client_general.generate_content(prompt_fix)
+        response_fix.resolve()
+        return response_fix.text.strip()
     except Exception as e:
+        print(f"Памылка пры выпраўленні субцітраў: {e}")  # Лагіраванне памылкі
+        return transcript
+def create_srt(transcript: str, filename: str = "subtitles.srt") -> tuple[str, str]:
+    """Стварае SRT-файл з транскрыпцыі."""
     try:
         with open(filename, "w", encoding="utf-8") as f:
             f.write(transcript)
         return transcript, filename
     except Exception as e:
+        return f"Памылка пры запісе SRT-файла: {e}", ""
+def process_audio(audio_path: str) -> tuple[str, str]:
+    """Апрацоўвае аўдыёфайл: транскрыбуе і стварае SRT."""
+    transcript = transcribe_audio(audio_path)
+    if transcript.startswith("Памылка") or transcript.startswith("Немагчыма"):
+        return transcript, ""  # Пусты радок замест None для файла
     fixed_transcript = fix_subtitles_format(transcript)
     text, srt_file = create_srt(fixed_transcript)
     return text, srt_file
+def extract_audio_from_video(video_file: str) -> tuple[str, str]:
+    """Выдзяляе аўдыёдарожку з відэафайла."""
     try:
         audio = AudioSegment.from_file(video_file)
         audio_path = "extracted_audio.mp3"
         audio.export(audio_path, format="mp3")
+        return audio_path, ""
     except Exception as e:
+        return "", f"Памылка пры выдзяленні аўдыё з відэафайла: {e}"
+def process_video(video_path: str) -> tuple[str, str]:
+    """Апрацоўвае відэафайл: выдзяляе аўдыё, транскрыбуе і стварае SRT."""
+    audio_path, error = extract_audio_from_video(video_path)
     if error:
+        return error, ""
     return process_audio(audio_path)
+def process_file(audio_path: str | None, video_path: str | None) -> tuple[str, str]:
+    """Апрацоўвае файл (аўдыё або відэа)."""
+    if audio_path:
+        return process_audio(audio_path)
+    elif video_path:
+        return process_video(video_path)
     else:
+        return "Няма файла для апрацоўкі.", ""
+def update_on_audio_change(audio_path: str | None) -> gr.update:
+    """Абнаўляе інтэрфейс пры змене аўдыёфайла."""
+    return gr.update(value=None, interactive=not bool(audio_path))
+def update_on_video_change(video_path: str | None) -> gr.update:
+    """Абнаўляе інтэрфейс пры змене відэафайла."""
+    return gr.update(value=None, interactive=not bool(video_path))
+def translate_transcript(
+    transcript: str, target_language: str
+) -> tuple[str, str]:
+    """Перакладае транскрыпцыю на іншую мову і стварае SRT."""
+    prompt_text = (
+        f"Перакладзі толькі тэксты субцітраў на {target_language} мову. "
+        "Астатняе пакінь як ёсць.\nТэкст:\n{transcript}"
+    )
     try:
+        response = client_general.generate_content(prompt_text)
+        response.resolve()
+        translated = response.text.strip()
         translated_srt_filename = "translated_subtitles.srt"
+        return create_srt(translated, translated_srt_filename)  # Перавыкарыстанне create_srt
     except Exception as e:
+        return f"Памылка пры перакладзе: {e}", ""
 with gr.Blocks() as demo:
     gr.Markdown("# Транскрыпцыя аўдыя для беларускай мовы")
     with gr.Row():
         audio_input = gr.Audio(type="filepath", label="Аўдыёфайл")
         video_input = gr.Video(label="Відэафайл")
+    #  Больш кампактны спосаб абнаўлення інтэрактыўнасці
+    audio_input.change(
+        fn=update_on_audio_change, inputs=audio_input, outputs=video_input
+    )
+    video_input.change(
+        fn=update_on_video_change, inputs=video_input, outputs=audio_input
+    )
     btn = gr.Button("Апрацаваць")
     transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
     file_output = gr.File(label="SRT-файл")
+    btn.click(
+        fn=process_file, inputs=[audio_input, video_input], outputs=[transcript_output, file_output]
+    )
     gr.Markdown("## Пераклад субцітраў")
     with gr.Row():
         language_dropdown = gr.Dropdown(
             choices=["English", "Руcкая", "Польская", "Літоўская", "Нямецкая"],
+            label="Выберы мову перакладу",
+            value="English",
         )
         translate_btn = gr.Button("Пераклад")
     translation_output = gr.Textbox(label="Пераклад", lines=10)
     translate_btn.click(
         fn=translate_transcript,
         inputs=[transcript_output, language_dropdown],
+        outputs=[translation_output, translation_file_output],
     )
 demo.launch()