Spaces:

Curinha
/

ContentCreatorsLab

Running on Zero

App Files Files Community

Curinha commited on 9 days ago

Commit

f26b7a5

1 Parent(s): b40961b

Implement GPU quota management and user registration for sound generation

Browse files

Files changed (2) hide show

app.py +182 -17
sound_generator.py +7 -4

app.py CHANGED Viewed

@@ -1,8 +1,14 @@
 import os
 import uvicorn
 from sound_generator import generate_sound, generate_music
-from fastapi import FastAPI, HTTPException, Request
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.templating import Jinja2Templates
 from fastapi.responses import FileResponse, HTMLResponse
@@ -17,7 +23,8 @@ app = FastAPI(
     redoc_url="/redoc",
 )
-# Cargar las plantillas desde la carpeta "templates"
 templates = Jinja2Templates(directory="templates")
 # Configuración de CORS
@@ -29,11 +36,145 @@ app.add_middleware(
     allow_headers=["*"],
 )
-# Define a Pydantic model to handle the input prompt
 class AudioRequest(BaseModel):
     prompt: str
 # Prueba para verificar si la API funciona - la dejamos por ahora para debugging
 @app.get("/health")
@@ -43,10 +184,15 @@ def health_check():
 @app.post("/generate-sound/")
-async def generate_sound_endpoint(request: AudioRequest):
     try:
-        # Llamada a la función para generar el sonido
-        audio_file_path = generate_sound(request.prompt)
         # Verifica si el archivo se ha generado correctamente
         if not os.path.exists(audio_file_path):
@@ -59,35 +205,54 @@ async def generate_sound_endpoint(request: AudioRequest):
             audio_file_path, media_type="audio/wav", filename="generated_audio.wav"
         )
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
 @app.post("/generate-music/")
-async def generate_music_endpoint(request: AudioRequest):
     try:
-        # Call the synchronous generate_music function
-        audio_file_path = generate_music(request.prompt)
-        # Verifies if the file has been generated correctly
         if not os.path.exists(audio_file_path):
             raise HTTPException(
                 status_code=404, detail="Archivo de audio no encontrado."
             )
-        # Return the generated file as a download response
         return FileResponse(
             audio_file_path, media_type="audio/wav", filename="generated_audio.wav"
         )
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
-@app.get("/", response_class=HTMLResponse)
-def home(request: Request):
-    """Página de inicio con información de la API"""
-    return templates.TemplateResponse("home.html", {"request": request})
 if __name__ == "__main__":

+import asyncio
+from datetime import datetime
 import os
+import random
+import time
+from typing import Dict, List
+import torch
 import uvicorn
 from sound_generator import generate_sound, generate_music
+from fastapi import Depends, FastAPI, HTTPException, Request
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.templating import Jinja2Templates
 from fastapi.responses import FileResponse, HTMLResponse
     redoc_url="/redoc",
 )
+# Configuración de templates
 templates = Jinja2Templates(directory="templates")
 # Configuración de CORS
     allow_headers=["*"],
 )
 class AudioRequest(BaseModel):
     prompt: str
+class GPUQuotaConfig:
+    MAX_REQUEST_DURATION = 20  # segundos máximos por solicitud
+    DAILY_QUOTA = 300  # 5 minutos en total (300 segundos)
+class QuotaTracker:
+    def __init__(self):
+        self.users_quota: Dict[str, int] = {}
+        self.user_reset_times: Dict[str, datetime] = {}
+        self.current_user_index = 0
+        self.registered_users: List[str] = []
+    def register_user(self, user_id: str):
+        if user_id not in self.registered_users:
+            self.registered_users.append(user_id)
+            self.users_quota[user_id] = GPUQuotaConfig.DAILY_QUOTA
+            self.user_reset_times[user_id] = datetime.now() + datetime.timedelta(days=1)
+    def get_next_available_user(self):
+        # Verificar resets
+        for user_id in list(self.user_reset_times.keys()):
+            if datetime.now() > self.user_reset_times[user_id]:
+                self.users_quota[user_id] = GPUQuotaConfig.DAILY_QUOTA
+                self.user_reset_times[user_id] = datetime.now() + datetime.timedelta(days=1)
+        # Encontrar usuario con cuota
+        attempts = 0
+        while attempts < len(self.registered_users):
+            self.current_user_index = (self.current_user_index + 1) % max(1, len(self.registered_users))
+            current_user = self.registered_users[self.current_user_index]
+            if self.users_quota.get(current_user, 0) >= GPUQuotaConfig.MAX_REQUEST_DURATION:
+                return current_user
+            attempts += 1
+        return None
+    def consume_quota(self, user_id: str, seconds: int):
+        if user_id in self.users_quota:
+            self.users_quota[user_id] = max(0, self.users_quota[user_id] - seconds)
+            return True
+        return False
+    def get_remaining_quota(self, user_id: str):
+        if user_id in self.users_quota:
+            # Verificar si se debe resetear
+            if datetime.now() > self.user_reset_times.get(user_id, datetime.max):
+                self.users_quota[user_id] = GPUQuotaConfig.DAILY_QUOTA
+                self.user_reset_times[user_id] = datetime.now() + datetime.timedelta(days=1)
+            return self.users_quota[user_id]
+        return 0
+    def get_system_status(self):
+        return {
+            "registered_users": len(self.registered_users),
+            "users_with_quota": sum(1 for q in self.users_quota.values() if q >= GPUQuotaConfig.MAX_REQUEST_DURATION),
+            "total_available_seconds": sum(self.users_quota.values())
+        }
+# Inicializar sistema
+quota_tracker = QuotaTracker()
+# Registrar usuarios virtuales
+for i in range(5):
+    quota_tracker.register_user(f"virtual_user_{i}")
+# Semáforo para controlar acceso a GPU - solo una tarea a la vez
+gpu_semaphore = asyncio.Semaphore(1)
+# Middleware para asignar user_id
+@app.middleware("http")
+async def assign_user_id(request: Request, call_next):
+    if "user-id" not in request.headers:
+        request.state.user_id = f"anonymous_{random.randint(1000, 9999)}"
+        quota_tracker.register_user(request.state.user_id)
+    else:
+        request.state.user_id = request.headers["user-id"]
+        quota_tracker.register_user(request.state.user_id)
+    response = await call_next(request)
+    return response
+async def get_user_id(request: Request):
+    return request.state.user_id
+# Función para manejar la generación con control de GPU
+async def process_with_gpu(generation_func, prompt, process_id):
+    start_time = time.time()
+    print(f"[{process_id}] Iniciando procesamiento GPU")
+    # Buscar usuario con cuota disponible
+    user_id = quota_tracker.get_next_available_user()
+    if not user_id:
+        raise HTTPException(status_code=429, detail="No hay cuota GPU disponible en el sistema")
+    quota_available = quota_tracker.get_remaining_quota(user_id)
+    print(f"[{process_id}] Usando cuota de usuario {user_id}: {quota_available}s disponibles")
+    # Verificar si hay suficiente cuota
+    if quota_available < GPUQuotaConfig.MAX_REQUEST_DURATION:
+        raise HTTPException(status_code=429, detail=f"Cuota GPU insuficiente ({quota_available}s disponibles)")
+    # Verificar que los modelos usen GPU si está disponible
+    use_gpu = torch.cuda.is_available()
+    device = 'cuda' if use_gpu else 'cpu'
+    print(f"[{process_id}] Usando dispositivo: {device}")
+    try:
+        # Llamar a la función de generación con límite de tiempo
+        audio_file_path = await asyncio.to_thread(
+            generation_func, prompt, device, user_id
+        )
+        # Liberar memoria GPU si se utilizó
+        if use_gpu:
+            torch.cuda.empty_cache()
+        # Calcular tiempo real usado
+        elapsed_time = min(GPUQuotaConfig.MAX_REQUEST_DURATION, int(time.time() - start_time))
+        # Consumir cuota
+        quota_tracker.consume_quota(user_id, elapsed_time)
+        print(f"[{process_id}] Procesamiento completado en {elapsed_time}s, cuota restante: {quota_tracker.get_remaining_quota(user_id)}s")
+        return audio_file_path
+    except Exception as e:
+        # Asegurar que liberamos memoria en caso de error
+        if use_gpu:
+            torch.cuda.empty_cache()
+        print(f"[{process_id}] Error: {str(e)}")
+        raise e
+# Home page with API information
+@app.get("/", response_class=HTMLResponse)
+def home(request: Request):
+    return templates.TemplateResponse("home.html", {"request": request})
 # Prueba para verificar si la API funciona - la dejamos por ahora para debugging
 @app.get("/health")
 @app.post("/generate-sound/")
+async def generate_sound_endpoint(request: AudioRequest, user_id: str = Depends(get_user_id)):
     try:
+        process_id = f"sound_{random.randint(1000, 9999)}"
+        # Usar semáforo para asegurar acceso exclusivo a GPU
+        async with gpu_semaphore:
+            audio_file_path = await process_with_gpu(
+                generate_sound, request.prompt, process_id
+            )
         # Verifica si el archivo se ha generado correctamente
         if not os.path.exists(audio_file_path):
             audio_file_path, media_type="audio/wav", filename="generated_audio.wav"
         )
+    except HTTPException as e:
+        # Reenviar excepciones HTTP
+        raise e
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
 @app.post("/generate-music/")
+async def generate_music_endpoint(request: AudioRequest, user_id: str = Depends(get_user_id)):
     try:
+        process_id = f"music_{random.randint(1000, 9999)}"
+        # Usar semáforo para asegurar acceso exclusivo a GPU
+        async with gpu_semaphore:
+            audio_file_path = await process_with_gpu(
+                generate_music, request.prompt, process_id
+            )
+        # Verifica si el archivo se ha generado correctamente
         if not os.path.exists(audio_file_path):
             raise HTTPException(
                 status_code=404, detail="Archivo de audio no encontrado."
             )
+        # Regresar el archivo generado como una respuesta de descarga
         return FileResponse(
             audio_file_path, media_type="audio/wav", filename="generated_audio.wav"
         )
+    except HTTPException as e:
+        # Reenviar excepciones HTTP
+        raise e
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
+@app.get("/quota-status")
+async def quota_status_endpoint(user_id: str = Depends(get_user_id)):
+    user_quota = quota_tracker.get_remaining_quota(user_id)
+    system_status = quota_tracker.get_system_status()
+    return {
+        "user_id": user_id,
+        "quota_remaining": user_quota,
+        "reset_time": quota_tracker.user_reset_times.get(user_id, None),
+        "system_status": system_status,
+        "gpu_available": torch.cuda.is_available(),
+        "device_info": torch.cuda.get_device_name(0) if torch.cuda.is_available() else "CPU"
+    }
 if __name__ == "__main__":

sound_generator.py CHANGED Viewed

@@ -16,8 +16,9 @@ music_model = MusicGen.get_pretrained('facebook/musicgen-small')
 sound_model.set_generation_params(duration=5)
 music_model.set_generation_params(duration=5)
-@spaces.GPU
-def generate_sound(prompt: str):
     """
     Generate sound using Audiocraft based on the given prompt.
@@ -27,6 +28,7 @@ def generate_sound(prompt: str):
     Returns:
     - str: The path to the saved audio file.
     """
     descriptions = [prompt]
     timestamp = str(time.time()).replace(".", "")
     wav = sound_model.generate(descriptions)  # Generate audio
@@ -36,8 +38,8 @@ def generate_sound(prompt: str):
     return f"{output_path}.wav"
-@spaces.GPU
-def generate_music(prompt: str):
     """
     Generate music using Audiocraft based on the given prompt.
@@ -47,6 +49,7 @@ def generate_music(prompt: str):
     Returns:
     - str: The path to the saved audio file.
     """
     descriptions = [prompt]
     timestamp = str(time.time()).replace(".", "")
     wav = music_model.generate(descriptions)  # Generate music

 sound_model.set_generation_params(duration=5)
 music_model.set_generation_params(duration=5)
+@spaces.GPU(duration=20)
+def generate_sound(prompt: str, user_id: str):
     """
     Generate sound using Audiocraft based on the given prompt.
     Returns:
     - str: The path to the saved audio file.
     """
+    print(f"Generando sonido para prompt: '{prompt}' en dispositivo {device} (usuario: {user_id})")
     descriptions = [prompt]
     timestamp = str(time.time()).replace(".", "")
     wav = sound_model.generate(descriptions)  # Generate audio
     return f"{output_path}.wav"
+@spaces.GPU(duration=20)
+def generate_music(prompt: str, user_id: str):
     """
     Generate music using Audiocraft based on the given prompt.
     Returns:
     - str: The path to the saved audio file.
     """
+    print(f"Generando sonido para prompt: '{prompt}' en dispositivo {device} (usuario: {user_id})")
     descriptions = [prompt]
     timestamp = str(time.time()).replace(".", "")
     wav = music_model.generate(descriptions)  # Generate music