Spaces:

archivartaunik
/

SubtitlesBE

Running

App Files Files Community

archivartaunik commited on Mar 18

Commit

3ab57cd

verified ·

1 Parent(s): c3bc5d7

Update app.py

Browse files

Files changed (1) hide show

app.py +58 -22

app.py CHANGED Viewed

@@ -1,32 +1,46 @@
 import os
 import gradio as gr
-from google import genai
-from google.genai import types  # імпартуем для выкарыстання GenerateContentConfig
 import mimetypes
 from pydub import AudioSegment
 # Атрыманне ключоў і мадэляў з пераменных асяроддзя
 GEMINI_API_KEY = os.getenv("gemini")
-MODEL_NAME_TH = os.getenv("modTH")
-MODEL_NAME = os.getenv("mod")
-P = os.getenv("p")
 # Стварэнне кліента з новым SDK
-client = genai.Client(api_key=GEMINI_API_KEY)
 def transcribe_audio(audio_file):
     try:
         mime_type, _ = mimetypes.guess_type(audio_file)
         if mime_type is None:
             return "Немагчыма вызначыць тып файла. Падтрымліваюцца толькі аўдыяфайлы."
         with open(audio_file, "rb") as f:
             audio_data = f.read()
-        prompt_text = P
-        response = client.models.generate_content(
             model=MODEL_NAME_TH,
-            contents=[prompt_text, {"mime_type": mime_type, "data": audio_data}],
-            config=types.GenerateContentConfig()  # можна дадаць дадатковыя параметры, калі патрэбна
         )
         if response.text:
             transcript = response.text.strip()
@@ -36,7 +50,8 @@ def transcribe_audio(audio_file):
     except FileNotFoundError:
         return "Памылка: Файл не знойдзены."
     except Exception as e:
-        return f"Нечаканая памылка: {str(e)}"
 def fix_subtitles_format(transcript):
     """
@@ -44,13 +59,15 @@ def fix_subtitles_format(transcript):
     """
     try:
         prompt_fix = (
-            f"Не змяняй тэксты, выправі толькі часовы фармат у субцітрах на правільны, вось прыклад 00:00:01,589 \n"
             f"У адказ напішы толькі субцітры: {transcript}"
         )
-        response_fix = client.models.generate_content(
             model=MODEL_NAME,
-            contents=prompt_fix,
-            config=types.GenerateContentConfig()
         )
         if response_fix.text:
             fixed_transcript = response_fix.text.strip()
@@ -60,7 +77,9 @@ def fix_subtitles_format(transcript):
     except Exception as e:
         return transcript
 def create_srt(transcript, filename="subtitles.srt"):
     try:
         with open(filename, "w", encoding="utf-8") as f:
             f.write(transcript)
@@ -68,7 +87,9 @@ def create_srt(transcript, filename="subtitles.srt"):
     except Exception as e:
         return f"Памылка пры запісе SRT-файла: {str(e)}", None
 def process_audio(audio):
     transcript = transcribe_audio(audio)
     if transcript.startswith("Памылка"):
         return transcript, None
@@ -77,7 +98,9 @@ def process_audio(audio):
     text, srt_file = create_srt(fixed_transcript)
     return text, srt_file
 def extract_audio_from_video(video_file):
     try:
         audio = AudioSegment.from_file(video_file)
         audio_path = "extracted_audio.mp3"
@@ -86,13 +109,17 @@ def extract_audio_from_video(video_file):
     except Exception as e:
         return None, f"Памылка пры выдзяленні аўдыі з відэафайла: {str(e)}"
 def process_video(video):
     audio_path, error = extract_audio_from_video(video)
     if error:
         return error, None
     return process_audio(audio_path)
 def process_file(audio, video):
     if audio is not None:
         return process_audio(audio)
     elif video is not None:
@@ -100,28 +127,36 @@ def process_file(audio, video):
     else:
         return "Няма файла для апрацоўкі.", None
 def update_on_audio_change(audio):
     if audio is not None:
         return gr.update(value=None, interactive=False)
     else:
         return gr.update(interactive=True)
 def update_on_video_change(video):
     if video is not None:
         return gr.update(value=None, interactive=False)
     else:
         return gr.update(interactive=True)
 def translate_transcript(transcript, target_language):
     try:
         prompt_text = (
             f"перакладзі толькі тэксты субцітраў на {target_language} мову. Астатня пакінь як ёсць.\n"
             f"Тэкст:\n{transcript}"
         )
-        response = client.models.generate_content(
             model=MODEL_NAME,
-            contents=prompt_text,
-            config=types.GenerateContentConfig()
         )
         if response.text:
             translated = response.text.strip()
@@ -134,6 +169,7 @@ def translate_transcript(transcript, target_language):
     except Exception as e:
         return f"Памылка пры перакладзе: {str(e)}", None
 with gr.Blocks() as demo:
     gr.Markdown("# Транскрыпцыя аўдыя для беларускай мовы")
     gr.Markdown(
@@ -149,12 +185,12 @@ with gr.Blocks() as demo:
         video_input = gr.Video(label="Відэафайл")
     audio_input.change(fn=update_on_audio_change, inputs=audio_input, outputs=video_input)
     video_input.change(fn=update_on_video_change, inputs=video_input, outputs=audio_input)
     btn = gr.Button("Апрацаваць")
     transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
     file_output = gr.File(label="SRT-файл")
     btn.click(fn=process_file, inputs=[audio_input, video_input], outputs=[transcript_output, file_output])
     gr.Markdown("## Пераклад субцітраў")
     with gr.Row():
         language_dropdown = gr.Dropdown(
@@ -170,4 +206,4 @@ with gr.Blocks() as demo:
         outputs=[translation_output, translation_file_output]
     )
-demo.launch()

 import os
 import gradio as gr
+from google.generativeai import Client, GenerationConfig  # Import GenerationConfig directly
 import mimetypes
 from pydub import AudioSegment
 # Атрыманне ключоў і мадэляў з пераменных асяроддзя
 GEMINI_API_KEY = os.getenv("gemini")
+MODEL_NAME_TH = os.getenv("modTH")
+MODEL_NAME = os.getenv("mod")
+P = os.getenv("p")
+# Праверка наяўнасці ключа API
+if not GEMINI_API_KEY:
+    raise ValueError("Памылка: пераменная асяроддзя 'gemini' не зададзена. Калі ласка, задайце ключ API.")
 # Стварэнне кліента з новым SDK
+client = Client(api_key=GEMINI_API_KEY)  # use Client instead of genai.Client
 def transcribe_audio(audio_file):
+    """Транскрыбіруе аўдыёфайл з дапамогай Gemini API."""
     try:
         mime_type, _ = mimetypes.guess_type(audio_file)
         if mime_type is None:
             return "Немагчыма вызначыць тып файла. Падтрымліваюцца толькі аўдыяфайлы."
         with open(audio_file, "rb") as f:
             audio_data = f.read()
+        # Падрыхтоўка запыту з prompt і аўдыё
+        contents = [
+            {"parts": [{"text": P}]},  # Prompt з пераменнай P
+            {"parts": [{"mime_type": mime_type, "data": audio_data}]}
+        ]
+        generation_config = GenerationConfig(  # Use GenerationConfig
+            # Добавьте параметры для управления генерацией (напрыклад, temperature, top_p)
+            # temperature=0.9,  # Напрыклад, для больш творчага выніку
+            # top_p=0.8,
+        )
+        response = client.generate_content(
             model=MODEL_NAME_TH,
+            contents=contents,
+            generation_config=generation_config,
         )
         if response.text:
             transcript = response.text.strip()
     except FileNotFoundError:
         return "Памылка: Файл не знойдзены."
     except Exception as e:
+        return f"Нечаканая памылка пры транскрыбаванні: {str(e)}"
 def fix_subtitles_format(transcript):
     """
     """
     try:
         prompt_fix = (
+            "Не змяняй тэксты, выправі толькі часовы фармат у субцітрах на правільны, вось прыклад 00:00:01,589 \n"
             f"У адказ напішы толькі субцітры: {transcript}"
         )
+        generation_config = GenerationConfig()  # Use GenerationConfig
+        response_fix = client.generate_content(
             model=MODEL_NAME,
+            contents=[{"parts": [{"text": prompt_fix}]}],
+            generation_config=generation_config,
         )
         if response_fix.text:
             fixed_transcript = response_fix.text.strip()
     except Exception as e:
         return transcript
 def create_srt(transcript, filename="subtitles.srt"):
+    """Стварае SRT-файл з дадзенай транскрыпцыяй."""
     try:
         with open(filename, "w", encoding="utf-8") as f:
             f.write(transcript)
     except Exception as e:
         return f"Памылка пры запісе SRT-файла: {str(e)}", None
 def process_audio(audio):
+    """Апрацоўвае асобны аўдыёфайл."""
     transcript = transcribe_audio(audio)
     if transcript.startswith("Памылка"):
         return transcript, None
     text, srt_file = create_srt(fixed_transcript)
     return text, srt_file
 def extract_audio_from_video(video_file):
+    """Выдзяляе аўдыё з відэафайла."""
     try:
         audio = AudioSegment.from_file(video_file)
         audio_path = "extracted_audio.mp3"
     except Exception as e:
         return None, f"Памылка пры выдзяленні аўдыі з відэафайла: {str(e)}"
 def process_video(video):
+    """Апрацоўвае відэафайл."""
     audio_path, error = extract_audio_from_video(video)
     if error:
         return error, None
     return process_audio(audio_path)
 def process_file(audio, video):
+    """Асноўная функцыя апрацоўкі, якая вызначае, што рабіць у залежнасці ад таго, які файл загружаны."""
     if audio is not None:
         return process_audio(audio)
     elif video is not None:
     else:
         return "Няма файла для апрацоўкі.", None
 def update_on_audio_change(audio):
+    """Абнаўляе інтэрфейс, калі змяняецца аўдыёфайл."""
     if audio is not None:
         return gr.update(value=None, interactive=False)
     else:
         return gr.update(interactive=True)
 def update_on_video_change(video):
+    """Абнаўляе інтэрфейс, калі змяняецца відэафайл."""
     if video is not None:
         return gr.update(value=None, interactive=False)
     else:
         return gr.update(interactive=True)
 def translate_transcript(transcript, target_language):
+    """Перакладае транскрыпцыю на абраную мову."""
     try:
         prompt_text = (
             f"перакладзі толькі тэксты субцітраў на {target_language} мову. Астатня пакінь як ёсць.\n"
             f"Тэкст:\n{transcript}"
         )
+        generation_config = GenerationConfig()  # Use GenerationConfig
+        response = client.generate_content(
             model=MODEL_NAME,
+            contents=[{"parts": [{"text": prompt_text}]}],
+            generation_config=generation_config,
         )
         if response.text:
             translated = response.text.strip()
     except Exception as e:
         return f"Памылка пры перакладзе: {str(e)}", None
 with gr.Blocks() as demo:
     gr.Markdown("# Транскрыпцыя аўдыя для беларускай мовы")
     gr.Markdown(
         video_input = gr.Video(label="Відэафайл")
     audio_input.change(fn=update_on_audio_change, inputs=audio_input, outputs=video_input)
     video_input.change(fn=update_on_video_change, inputs=video_input, outputs=audio_input)
     btn = gr.Button("Апрацаваць")
     transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
     file_output = gr.File(label="SRT-файл")
     btn.click(fn=process_file, inputs=[audio_input, video_input], outputs=[transcript_output, file_output])
     gr.Markdown("## Пераклад субцітраў")
     with gr.Row():
         language_dropdown = gr.Dropdown(
         outputs=[translation_output, translation_file_output]
     )
+demo.launch()