Spaces:

Jiangxz01
/

Generated_Podcast_Audio

Sleeping

File size: 6,916 Bytes

# -*- coding: utf-8 -*-
# 財政部財政資訊中心 江信宗

import gradio as gr
import openai
import os

def create_client(api_key=None):
    if api_key:
        openai.api_key = api_key
    else:
        openai.api_key = os.getenv("YOUR_API_TOKEN")
    return openai.OpenAI(api_key=openai.api_key, base_url="https://api.sambanova.ai/v1")

def generate_response(input_text, language, speaker1, speaker2, api_key):
    speaker1_name = speaker1.split(' - ')[0]
    speaker2_name = speaker2.split(' - ')[0]
    if language == "Auto Detect":
        language_instruction = "- The podcast MUST be in the same language as the user input."
    else:
        language_instruction = f"- The podcast MUST be in {language} language"
    print(language_instruction)
    system_prompt = f"""你的任務是將提供的輸入文字轉換為一個引人入勝、訊息豐富且專業的Podcast對話。輸入文字可能會比較混亂或結構不完整，因為它可能來自不同來源，如PDF檔案或文字檔等。不要擔心格式問題或任何不相關的訊息；你的目標是提取可以在Podcast中討論的關鍵點、識別重要定義，並突出有趣的事實。



以下是你將要處理的輸入文字：

<input_text>

{{input_text}}

</input_text>



首先，仔細閱讀輸入文字，找出主要話題、關鍵點，以及任何有趣的事實或軼事。思考如何將這些訊息以一種有趣且吸引人的方式呈現出來，適合高質量的音訊Podcast。



<scratchpad>

頭腦風暴一些創造性的方法來討論你在輸入文字中識別出的主要話題、關鍵點及任何有趣的事實或軼事。可以考慮使用類比、講故事技巧或假設情境來讓內容對聽眾更加貼近和有趣。



請記住，你的Podcast應當易於普通聽眾理解，所以避免使用過多的專業術語或假設聽眾對該話題已有瞭解。如有必要，請思考如何用簡單的術語簡要解釋任何複雜的概念。



利用你的想像力填補輸入文字中的任何空白，或者想出一些值得探討與發人深省的問題，以供Podcast討論。目標是創造一個訊息豐富且娛樂性強的對話，因此可以在你的方法上大膽自由發揮創意。



將你的頭腦風暴想法和Podcast對話的粗略大綱寫在這裡。確保記錄下你希望在結尾重申的主要見解和要點。

</scratchpad>



現在你已經進行了頭腦風暴並建立了一個粗略的大綱，是時候撰寫實際的Podcast對話了。目標是主持人({speaker1_name})與嘉賓({speaker2_name})之間自然、對話式的交流。融入你在頭腦風暴中得出的最佳想法，並確保將任何複雜話題以易於理解的方式解釋清楚。

{language_instruction}

- The podcast should have 2 speakers: {speaker1_name} and {speaker2_name}.

- The podcast should be long.

- The podcast should be interesting, lively, and engaging, and hook the listener from the start.

- The script must be in JSON format.

Follow this example structure:

```

{{

  "speaker1": "歡迎收聽財資歐北共Podcast，我是主持人{speaker1_name}，今天我們邀請到專家{speaker2_name}，百忙之中來上我們節目",

  "speaker2": "大家好，我是{speaker2_name}，很榮幸能來跟大家一起聊聊",

  "speaker1": "今天我們將探討一個非常有趣的話題……",

  "speaker2": "沒錯，這個話題確實讓人著迷，讓我們先從……開始說起吧……",

  …………

  "speaker1": "謝謝{speaker2_name}的專業分享，歡迎訂閱來許願Podcast節目喔，我們下次再見"

}}

```



<podcast_dialogue>

根據你在頭腦風暴階段提出的關鍵點和創造性想法，撰寫你的引人入勝、訊息豐富的Podcast對話。採用對話式的語氣，並包括任何必要的上下文或解釋，使內容對一般聽眾而言容易理解。使用主持人名字 {speaker1_name} 和嘉賓名字 {speaker2_name}，以營造更吸引人和身臨其境的聆聽體驗。不要包括像[主持人]或[嘉賓]這樣的括號預留位置。設計你的輸出內容以供直接朗讀——它將直接轉換為音訊。



確保對話儘可能詳細、完整，同時保持在主題之內並維持吸引人的流暢性。目標是使用你的全部輸出容量，建立儘可能長的Podcast節目，同時以有趣的方式傳遞輸入文字中的關鍵訊息。



在對話結束時，讓主持人和嘉賓自然總結他們討論中的主要見解和要點。這應當是對話的隨機部分，以自然隨意而非明顯的總結——目的是在結束前最後一次以自然流暢的方式強化核心思想。最終以感謝詞結束。

</podcast_dialogue>

"""
    client = create_client(api_key)
    response = client.chat.completions.create(
        model="Meta-Llama-3.1-405B-Instruct",
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": input_text}
        ],
        temperature=1
    )
    return response.choices[0].message.content

with gr.Blocks() as iface:
    gr.Markdown("# 🎙️ Generated Podcast Audio. Deployed by 江信宗")
    
    input_text = gr.Textbox(label="請輸入您的文字")
    
    with gr.Row():
        Language = gr.Dropdown(
            choices=["繁體中文", "Auto Detect", "英文", "日文", "韓文"], 
            value="繁體中文", 
            label="語言",
            interactive=True,
            scale=1
        )
        
        speaker_choices = [
            "Andrew - English (United States)",
            "Ava - English (United States)",
            "Brian - English (United States)",
            "Emma - English (United States)",
            "Florian - German (Germany)",
            "Seraphina - German (Germany)",
            "Remy - French (France)",
            "Vivienne - French (France)"
        ]
        
        Speaker_1 = gr.Dropdown(
            choices=speaker_choices, 
            value="Andrew - English (United States)", 
            label="主持人的語音",
            interactive=True,
            scale=2
        )
        Speaker_2 = gr.Dropdown(
            choices=speaker_choices, 
            value="Ava - English (United States)", 
            label="來賓的語音",
            interactive=True,
            scale=2
        )
    
    api_key = gr.Textbox(label="API Key", type="password", placeholder="API authentication key for large language models")
    output_text = gr.Textbox(label="生成的結果")
    
    generate_button = gr.Button("生成")
    generate_button.click(fn=generate_response, inputs=[input_text, Language, Speaker_1, Speaker_2, api_key], outputs=output_text)

if __name__ == "__main__":
    if "SPACE_ID" in os.environ:
        iface.launch()
    else:
        iface.launch(share=True, show_api=False)