Spaces:

JeCabrera
/

copywriter

Running

App Files Files Community

JeCabrera commited on Jan 18

Commit

f981512

verified ·

1 Parent(s): 8d45e13

Update app.py

Browse files

Files changed (1) hide show

app.py +85 -13

app.py CHANGED Viewed

@@ -1,19 +1,91 @@
-import gradio as gr
 import time
-def echo(message, history, system_prompt, tokens):
-    response = f"System prompt: {system_prompt}\n Message: {message}."
-    for i in range(min(len(response), int(tokens))):
-        time.sleep(0.05)
-        yield response[: i + 1]
 demo = gr.ChatInterface(
-    echo,
-    type="messages",
-    additional_inputs=[
-        gr.Textbox("You are helpful AI.", label="System Prompt"),
-        gr.Slider(10, 100),
-    ],
 )
-demo.launch()

+import os
 import time
+import uuid
+from typing import List, Tuple, Optional, Union
+from PIL import Image
+import google.generativeai as genai
+import gradio as gr
+from dotenv import load_dotenv
+# Cargar las variables de entorno desde el archivo .env
+load_dotenv()
+API_KEY = os.getenv("GOOGLE_API_KEY")
+if not API_KEY:
+    raise ValueError("La clave de API 'GOOGLE_API_KEY' no está configurada en el archivo .env")
+# Configuración del modelo Gemini
+genai.configure(api_key=API_KEY)
+generation_config = {
+    "temperature": 0.7,
+    "top_p": 0.9,
+    "top_k": 40,
+    "max_output_tokens": 8192,
+    "response_mime_type": "text/plain",
+}
+model = genai.GenerativeModel(
+    model_name="gemini-1.5-flash",
+    generation_config=generation_config,
+)
+# Constantes para el manejo de imágenes
+IMAGE_CACHE_DIRECTORY = "/tmp"
+IMAGE_WIDTH = 512
+CHAT_HISTORY = List[Tuple[Optional[Union[Tuple[str], str]], Optional[str]]]
+# Función para preprocesar una imagen
+def preprocess_image(image: Image.Image) -> Optional[Image.Image]:
+    """Redimensiona una imagen manteniendo la relación de aspecto."""
+    if image:
+        image_height = int(image.height * IMAGE_WIDTH / image.width)
+        return image.resize((IMAGE_WIDTH, image_height))
+# Función para almacenar una imagen en caché
+def cache_pil_image(image: Image.Image) -> str:
+    """Guarda la imagen como archivo JPEG en un directorio temporal."""
+    image_filename = f"{uuid.uuid4()}.jpeg"
+    os.makedirs(IMAGE_CACHE_DIRECTORY, exist_ok=True)
+    image_path = os.path.join(IMAGE_CACHE_DIRECTORY, image_filename)
+    image.save(image_path, "JPEG")
+    return image_path
+# Función principal para manejar las respuestas del chat
+def response(message, history):
+    """Maneja la interacción multimodal y envía texto e imágenes al modelo."""
+    text_prompt = message["text"]
+    files = message["files"]
+    # Procesar imágenes cargadas
+    image_prompts = []
+    if files:
+        for file in files:
+            image = Image.open(file).convert('RGB')
+            image_preview = preprocess_image(image)
+            if image_preview:
+                cache_pil_image(image)
+                image_prompts.append(image_preview)  # Incluir en la lista de prompts
+    # Concatenar texto e imágenes para el modelo
+    prompts = [text_prompt] + image_prompts
+    response = model.generate_content(prompts, stream=True, generation_config=generation_config)
+    # Generar respuesta paso a paso
+    for chunk in response:
+        yield chunk.text
+# Crear la interfaz de usuario
 demo = gr.ChatInterface(
+    response,
+    examples=[{"text": "Describe the image:", "files": []}],
+    multimodal=True,
+    textbox=gr.MultimodalTextbox(
+        file_count="multiple",
+        file_types=["image"],
+        sources=["upload", "microphone"],
+    ),
 )
+# Lanzar la aplicación
+if __name__ == "__main__":
+    demo.launch(debug=True, show_error=True)