Spaces:

Niansuh
/

elve

Running

App Files Files Community

Niansuh commited on Mar 9

Commit

b0662ae

verified ·

1 Parent(s): 4119088

Update tts_script.py

Browse files

Files changed (1) hide show

tts_script.py +35 -53

tts_script.py CHANGED Viewed

@@ -2,8 +2,8 @@ import time
 import requests
 import pathlib
 from io import BytesIO
-from flask import Flask, request, jsonify, send_file
-from concurrent.futures import ThreadPoolExecutor, as_completed
 # Flask App Setup
 app = Flask(__name__)
@@ -11,11 +11,9 @@ app = Flask(__name__)
 # ElevenLabs API Configuration
 ELEVENLABS_API_URL = "https://api.elevenlabs.io/v1/text-to-speech"
 HEADERS = {"User-Agent": "TTSApp"}
-# Change cache directory to a writable location
 CACHE_DIR = pathlib.Path("/tmp/audio_cache")
 CACHE_DIR.mkdir(parents=True, exist_ok=True)
 # Available Voices
 ALL_VOICES = {
     "Brian": "nPczCjzI2devNBz1zQrb",
@@ -35,65 +33,49 @@ def generate_audio(text, voice):
     filename = CACHE_DIR / f"{int(time.time())}.mp3"
     sentences = split_sentences(text)
-    def fetch_audio(sentence, part_number):
-        try:
-            response = requests.post(
-                f"{ELEVENLABS_API_URL}/{ALL_VOICES[voice]}",
-                headers=HEADERS,
-                json={"text": sentence, "model_id": "eleven_multilingual_v2"},
-                timeout=20
-            )
-            response.raise_for_status()
-            return part_number, response.content
-        except requests.RequestException:
-            return part_number, None
-    audio_chunks = {}
-    with ThreadPoolExecutor() as executor:
-        futures = {executor.submit(fetch_audio, sentence.strip(), i): i for i, sentence in enumerate(sentences)}
-        for future in as_completed(futures):
-            part_number, audio_data = future.result()
-            if audio_data:
-                audio_chunks[part_number] = audio_data
-    combined_audio = BytesIO()
-    for part_number in sorted(audio_chunks.keys()):
-        combined_audio.write(audio_chunks[part_number])
-    with open(filename, "wb") as f:
-        f.write(combined_audio.getvalue())
     return filename.as_posix()
 # Flask Routes
-@app.route("/")
 def home():
-    return '''
-    <h1>Text-to-Speech API</h1>
-    <form action="/tts" method="post">
-        <label>Text:</label>
-        <input type="text" name="text" required>
         <label>Voice:</label>
         <select name="voice">
             <option value="Brian">Brian</option>
             <option value="Alice">Alice</option>
             <option value="Will">Will</option>
-        </select>
-        <button type="submit">Generate</button>
     </form>
-    '''
-@app.route("/tts", methods=["POST"])
-def tts():
-    text = request.form.get("text")
-    voice = request.form.get("voice", "Brian")
-    if not text:
-        return jsonify({"error": "Text is required!"})
-    audio_file = generate_audio(text, voice)
-    return send_file(audio_file, as_attachment=True)
 if __name__ == "__main__":
     app.run(debug=True, host="0.0.0.0", port=5000)

 import requests
 import pathlib
 from io import BytesIO
+from flask import Flask, request, render_template, send_file
+from pydub import AudioSegment
 # Flask App Setup
 app = Flask(__name__)
 # ElevenLabs API Configuration
 ELEVENLABS_API_URL = "https://api.elevenlabs.io/v1/text-to-speech"
 HEADERS = {"User-Agent": "TTSApp"}
 CACHE_DIR = pathlib.Path("/tmp/audio_cache")
 CACHE_DIR.mkdir(parents=True, exist_ok=True)
 # Available Voices
 ALL_VOICES = {
     "Brian": "nPczCjzI2devNBz1zQrb",
     filename = CACHE_DIR / f"{int(time.time())}.mp3"
     sentences = split_sentences(text)
+    audio_chunks = []
+    for sentence in sentences:
+        response = requests.post(
+            f"{ELEVENLABS_API_URL}/{ALL_VOICES[voice]}",
+            headers=HEADERS,
+            json={"text": sentence, "model_id": "eleven_multilingual_v2"},
+            timeout=20
+        )
+        if response.ok:
+            audio_chunks.append(BytesIO(response.content))
+    # Combine all audio parts
+    combined_audio = AudioSegment.empty()
+    for chunk in audio_chunks:
+        chunk_audio = AudioSegment.from_file(chunk, format="mp3")
+        combined_audio += chunk_audio
+    combined_audio.export(filename, format="mp3")
     return filename.as_posix()
 # Flask Routes
+@app.route("/", methods=["GET", "POST"])
 def home():
+    if request.method == "POST":
+        text = request.form["text"]
+        voice = request.form.get("voice", "Brian")
+        audio_file = generate_audio(text, voice)
+        return send_file(audio_file, as_attachment=True)
+    return """
+    <h1>Text-to-Speech Generator</h1>
+    <form method="post">
+        <label>Text:</label><br>
+        <textarea name="text" rows="4" cols="50" required></textarea><br>
         <label>Voice:</label>
         <select name="voice">
             <option value="Brian">Brian</option>
             <option value="Alice">Alice</option>
             <option value="Will">Will</option>
+        </select><br><br>
+        <button type="submit">Generate & Download</button>
     </form>
+    """
 if __name__ == "__main__":
     app.run(debug=True, host="0.0.0.0", port=5000)