Spaces:

archivartaunik
/

SubtitlesBE

Running

App Files Files Community

archivartaunik commited on Mar 18

Commit

a9913d9

verified ·

1 Parent(s): 7d946d9

Update app.py

Browse files

Files changed (1) hide show

app.py +46 -78

app.py CHANGED Viewed

@@ -1,165 +1,133 @@
 import os
 import gradio as gr
-import google.generativeai as genai
 import mimetypes
 from pydub import AudioSegment
 # Атрыманне ключоў і мадэляў з пераменных асяроддзя
 GEMINI_API_KEY = os.getenv("gemini")
-MODEL_NAME_TH = os.getenv("modTH")  # Мадэль для транскрыпцыі
-MODEL_NAME = os.getenv("mod")       # Мадэль для выпраўлення фармату і перакладу
-PROMPT_TRANSCRIBE = os.getenv("p")  # Промпт для транскрыпцыі
-# Наладжваем API-ключ
-genai.configure(api_key=GEMINI_API_KEY)
 def transcribe_audio(audio_file: str) -> str:
-    """Транскрыбуе аўдыяфайл з дапамогай Google Generative AI."""
     try:
         mime_type, _ = mimetypes.guess_type(audio_file)
         if not mime_type or not mime_type.startswith("audio"):
-            return (
-                "Немагчыма вызначыць тып файла або файл не з'яўляецца аўдыяфайлам. "
-                "Падтрымліваюцца толькі аўдыяфайлы."
-            )
         with open(audio_file, "rb") as f:
             audio_data = f.read()
-        response = genai.generate_text(
-            model=MODEL_NAME_TH,
-            prompt=[PROMPT_TRANSCRIBE, {"mime_type": mime_type, "data": audio_data}],
-            # Пры жаданні можна дадаць дадатковыя параметры, напр. temperature=0.2
         )
-        return response.result.strip()
-    except FileNotFoundError:
-        return "Памылка: Файл не знойдзены."
     except Exception as e:
-        return f"Нечаканая памылка: {e}"
 def fix_subtitles_format(transcript: str) -> str:
-    """Выпраўляе фармат часу ў субцітрах."""
     prompt_fix = (
-        "Не змяняй тэксты, выправі толькі часовы фармат у субцітрах на правільны, "
-        "вось прыклад 00:00:01,589. \nУ адказ напішы толькі субцітры:\n"
         f"{transcript}"
     )
     try:
-        response_fix = genai.generate_text(model=MODEL_NAME, prompt=prompt_fix)
-        return response_fix.result.strip()
     except Exception as e:
-        print(f"Памылка пры выпраўленні субцітраў: {e}")  # Лагіраванне памылкі
         return transcript
 def create_srt(transcript: str, filename: str = "subtitles.srt") -> tuple[str, str]:
-    """Стварае SRT-файл з транскрыпцыі."""
     try:
         with open(filename, "w", encoding="utf-8") as f:
             f.write(transcript)
         return transcript, filename
     except Exception as e:
-        return f"Памылка пры запісе SRT-файла: {e}", ""
 def process_audio(audio_path: str) -> tuple[str, str]:
-    """Апрацоўвае аўдыёфайл: транскрыбуе і стварае SRT."""
     transcript = transcribe_audio(audio_path)
-    if transcript.startswith("Памылка") or transcript.startswith("Немагчыма"):
-        return transcript, ""  # Пусты радок замест None для файла
     fixed_transcript = fix_subtitles_format(transcript)
-    text, srt_file = create_srt(fixed_transcript)
-    return text, srt_file
 def extract_audio_from_video(video_file: str) -> tuple[str, str]:
-    """Выдзяляе аўдыёдарожку з відэафайла."""
     try:
         audio = AudioSegment.from_file(video_file)
         audio_path = "extracted_audio.mp3"
         audio.export(audio_path, format="mp3")
         return audio_path, ""
     except Exception as e:
-        return "", f"Памылка пры выдзяленні аўдыё з відэафайла: {e}"
 def process_video(video_path: str) -> tuple[str, str]:
-    """Апрацоўвае відэафайл: выдзяляе аўдыё, транскрыбуе і стварае SRT."""
     audio_path, error = extract_audio_from_video(video_path)
     if error:
         return error, ""
     return process_audio(audio_path)
 def process_file(audio_path: str | None, video_path: str | None) -> tuple[str, str]:
-    """Апрацоўвае файл (аўдыё або відэа)."""
     if audio_path:
         return process_audio(audio_path)
     elif video_path:
         return process_video(video_path)
-    else:
-        return "Няма файла для апрацоўкі.", ""
-def update_on_audio_change(audio_path: str | None) -> gr.update:
-    """Абнаўляе інтэрфейс пры змене аўдыёфайла."""
-    return gr.update(value=None, interactive=not bool(audio_path))
-def update_on_video_change(video_path: str | None) -> gr.update:
-    """Абнаўляе інтэрфейс пры змене відэафайла."""
-    return gr.update(value=None, interactive=not bool(video_path))
-def translate_transcript(
-    transcript: str, target_language: str
-) -> tuple[str, str]:
-    """Перакладае транскрыпцыю на іншую мову і стварае SRT."""
     prompt_text = (
-        f"Перакладзі толькі тэксты субцітраў на {target_language} мову. "
-        "Астатняе пакінь як ёсць.\nТэкст:\n{transcript}"
     )
     try:
-        response = genai.generate_text(model=MODEL_NAME, prompt=prompt_text)
-        translated = response.result.strip()
-        translated_srt_filename = "translated_subtitles.srt"
-        return create_srt(translated, translated_srt_filename)  # Перавыкарыстанне create_srt
     except Exception as e:
-        return f"Памылка пры перакладзе: {e}", ""
 with gr.Blocks() as demo:
-    gr.Markdown("# Транскрыпцыя аўдыя для беларускай мовы")
-    gr.Markdown(
-        """
-## Загрузіце аўдыёфайл або відэафайл да 15 хвілін. Калі загружаны аўдыёфайл, відэа неактыўна, і наадварот.
-Субцітры будуць аўтаматычна згенераваны разам з SRT-файлам.
-[Далучайцеся да беларускаймоўнай суполкі ў ТГ](https://t.me/belarusai)
-**Падтрымаць праект:** [Buy me a coffee](https://buymeacoffee.com/tuteishygpt)
-        """
-    )
     with gr.Row():
         audio_input = gr.Audio(type="filepath", label="Аўдыёфайл")
         video_input = gr.Video(label="Відэафайл")
-    # Больш кампактны спосаб абнаўлення інтэрактыўнасці
-    audio_input.change(
-        fn=update_on_audio_change, inputs=audio_input, outputs=video_input
-    )
-    video_input.change(
-        fn=update_on_video_change, inputs=video_input, outputs=audio_input
-    )
     btn = gr.Button("Апрацаваць")
     transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
     file_output = gr.File(label="SRT-файл")
     btn.click(
-        fn=process_file, inputs=[audio_input, video_input], outputs=[transcript_output, file_output]
     )
     gr.Markdown("## Пераклад субцітраў")
     with gr.Row():
         language_dropdown = gr.Dropdown(
-            choices=["English", "Руcкая", "Польская", "Літоўская", "Нямецкая"],
-            label="Выберы мову перакладу",
             value="English",
         )
-        translate_btn = gr.Button("Пераклад")
     translation_output = gr.Textbox(label="Пераклад", lines=10)
     translation_file_output = gr.File(label="Translated SRT-файл")
     translate_btn.click(
         fn=translate_transcript,
         inputs=[transcript_output, language_dropdown],

 import os
 import gradio as gr
+from google import genai
 import mimetypes
 from pydub import AudioSegment
 # Атрыманне ключоў і мадэляў з пераменных асяроддзя
 GEMINI_API_KEY = os.getenv("gemini")
+MODEL_NAME_TH = os.getenv("modTH")
+MODEL_NAME = os.getenv("mod")
+PROMPT_TRANSCRIBE = os.getenv("p")
+# Стварэнне сесіі і мадэляў
+session = genai.Session(api_key=GEMINI_API_KEY)
+model_th = genai.GenerativeModel(model_name=MODEL_NAME_TH, session=session)
+model_general = genai.GenerativeModel(model_name=MODEL_NAME, session=session)
 def transcribe_audio(audio_file: str) -> str:
     try:
         mime_type, _ = mimetypes.guess_type(audio_file)
         if not mime_type or not mime_type.startswith("audio"):
+            return "Файл не аўдыёфармату."
         with open(audio_file, "rb") as f:
             audio_data = f.read()
+        response = model_th.generate_content(
+            [PROMPT_TRANSCRIBE, {"mime_type": mime_type, "data": audio_data}]
         )
+        return response.text.strip()
     except Exception as e:
+        return f"Памылка: {e}"
 def fix_subtitles_format(transcript: str) -> str:
     prompt_fix = (
+        "Не змяняй тэксты, толькі выправі фармат часу ў субцітрах на 00:00:01,589:\n"
         f"{transcript}"
     )
     try:
+        response_fix = model_general.generate_content(prompt_fix)
+        return response_fix.text.strip()
     except Exception as e:
         return transcript
 def create_srt(transcript: str, filename: str = "subtitles.srt") -> tuple[str, str]:
     try:
         with open(filename, "w", encoding="utf-8") as f:
             f.write(transcript)
         return transcript, filename
     except Exception as e:
+        return f"Памылка запісу SRT: {e}", ""
 def process_audio(audio_path: str) -> tuple[str, str]:
     transcript = transcribe_audio(audio_path)
+    if transcript.startswith("Памылка"):
+        return transcript, ""
     fixed_transcript = fix_subtitles_format(transcript)
+    return create_srt(fixed_transcript)
 def extract_audio_from_video(video_file: str) -> tuple[str, str]:
     try:
         audio = AudioSegment.from_file(video_file)
         audio_path = "extracted_audio.mp3"
         audio.export(audio_path, format="mp3")
         return audio_path, ""
     except Exception as e:
+        return "", f"Памылка аўдыё з відэа: {e}"
 def process_video(video_path: str) -> tuple[str, str]:
     audio_path, error = extract_audio_from_video(video_path)
     if error:
         return error, ""
     return process_audio(audio_path)
 def process_file(audio_path: str | None, video_path: str | None) -> tuple[str, str]:
     if audio_path:
         return process_audio(audio_path)
     elif video_path:
         return process_video(video_path)
+    return "Няма файла для апрацоўкі.", ""
+def translate_transcript(transcript: str, target_language: str) -> tuple[str, str]:
     prompt_text = (
+        f"Перакладзі тэксты субцітраў на {target_language} мову, астатняе не змяняй:\n{transcript}"
     )
     try:
+        response = model_general.generate_content(prompt_text)
+        translated = response.text.strip()
+        return create_srt(translated, "translated_subtitles.srt")
     except Exception as e:
+        return f"Памылка перакладу: {e}", ""
 with gr.Blocks() as demo:
+    gr.Markdown("# Транскрыпцыя аўдыя (беларуская мова)")
     with gr.Row():
         audio_input = gr.Audio(type="filepath", label="Аўдыёфайл")
         video_input = gr.Video(label="Відэафайл")
     btn = gr.Button("Апрацаваць")
     transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
     file_output = gr.File(label="SRT-файл")
     btn.click(
+        fn=process_file,
+        inputs=[audio_input, video_input],
+        outputs=[transcript_output, file_output],
     )
     gr.Markdown("## Пераклад субцітраў")
     with gr.Row():
         language_dropdown = gr.Dropdown(
+            ["English", "Руcкая", "Польская", "Літоўская", "Нямецкая"],
+            label="Мова перакладу",
             value="English",
         )
+        translate_btn = gr.Button("Перакласці")
     translation_output = gr.Textbox(label="Пераклад", lines=10)
     translation_file_output = gr.File(label="Translated SRT-файл")
     translate_btn.click(
         fn=translate_transcript,
         inputs=[transcript_output, language_dropdown],