Spaces:

JeCabrera
/

copywriter

Running

File size: 4,512 Bytes

f981512
8d45e13
4ad1ff2
 
03a628f
f981512
 
 
 
5010813
f981512
03a628f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
56a81a0
03a628f
 
99ca542
03a628f
4ad1ff2
5010813
4ad1ff2
 
03a628f
4ad1ff2
03a628f
4ad1ff2
 
 
 
03a628f
4ad1ff2
03a628f
4ad1ff2
 
 
 
 
 
03a628f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c4c0dbd
 
 
 
373337e
c4c0dbd
373337e
c95977a
c4c0dbd
 
c95977a
c4c0dbd
c95977a
c4c0dbd
c95977a
0a5222b
c4c0dbd
c95977a
616f0cb
5010813
03a628f

import os
import time
import uuid
from typing import List, Tuple, Optional, Union
from PIL import Image
import google.generativeai as genai
import gradio as gr
from dotenv import load_dotenv

# Cargar las variables de entorno desde el archivo .env
load_dotenv()
API_KEY = os.getenv("GOOGLE_API_KEY")

if not API_KEY:
    raise ValueError("La clave de API 'GOOGLE_API_KEY' no está configurada en el archivo .env")

# Configuración del modelo Gemini
genai.configure(api_key=API_KEY)
generation_config = {
    "temperature": 0.7,
    "top_p": 0.9,
    "top_k": 40,
    "max_output_tokens": 8192,
    "response_mime_type": "text/plain",
}

model = genai.GenerativeModel(
    model_name="gemini-1.5-flash",
    generation_config=generation_config,
)

# Inicializar la sesión de chat
chat = model.start_chat(history=[])

# Constantes para el manejo de imágenes
IMAGE_CACHE_DIRECTORY = "/tmp"
IMAGE_WIDTH = 512
CHAT_HISTORY = List[Tuple[Optional[Union[Tuple[str], str]], Optional[str]]]

# Función para preprocesar una imagen
def preprocess_image(image: Image.Image) -> Optional[Image.Image]:
    """Redimensiona una imagen manteniendo la relación de aspecto."""
    if image:
        image_height = int(image.height * IMAGE_WIDTH / image.width)
        return image.resize((IMAGE_WIDTH, image_height))

# Función para almacenar una imagen en caché
def cache_pil_image(image: Image.Image) -> str:
    """Guarda la imagen como archivo JPEG en un directorio temporal."""
    image_filename = f"{uuid.uuid4()}.jpeg"
    os.makedirs(IMAGE_CACHE_DIRECTORY, exist_ok=True)
    image_path = os.path.join(IMAGE_CACHE_DIRECTORY, image_filename)
    image.save(image_path, "JPEG")
    return image_path

# Función para transformar el historial de Gradio al formato de Gemini
def transform_history(history):
    """Transforma el historial del formato de Gradio al formato que Gemini espera."""
    new_history = []
    for chat in history:
        if chat[0]:  # Mensaje del usuario
            new_history.append({"parts": [{"text": chat[0]}], "role": "user"})
        if chat[1]:  # Respuesta del modelo
            new_history.append({"parts": [{"text": chat[1]}], "role": "model"})
    return new_history

# Función principal para manejar las respuestas del chat
def response(message, history):
    """Maneja la interacción multimodal y envía texto e imágenes al modelo."""
    global chat

    # Transformar el historial al formato esperado por Gemini
    chat.history = transform_history(history)

    # Obtener el texto del mensaje y las imágenes cargadas
    text_prompt = message["text"]
    files = message["files"]

    # Procesar imágenes cargadas
    image_prompts = [preprocess_image(Image.open(file).convert('RGB')) for file in files] if files else []
    if files:
        for file in files:
            image = Image.open(file).convert('RGB')
            image_preview = preprocess_image(image)
            if image_preview:
                # Guardar la imagen y obtener la ruta
                image_path = cache_pil_image(image)
                # Leer la imagen en formato binario para enviarla como Blob
                with open(image_path, "rb") as img_file:
                    img_data = img_file.read()
                # Crear un diccionario con los datos binarios y su tipo MIME
                image_prompt = {
                    "mime_type": "image/jpeg",
                    "data": img_data
                }
                image_prompts.append(image_prompt)

    # Combinar texto e imágenes para el modelo
    prompts = [text_prompt] + image_prompts
    response = chat.send_message(prompts)
    response.resolve()

    # Generar respuesta carácter por carácter para una experiencia más fluida
    for i in range(len(response.text)):
        time.sleep(0.01)
        yield response.text[: i + 1]

# Función para manejar votos
def vote(data: gr.LikeData):
    """Procesa la retroalimentación del usuario (like/dislike)."""
    if data.liked:
        print(f"Respuesta aprobada: " + data.value["value"])
    else:
        print(f"Respuesta desaprobada: " + data.value["value"])

# Crear la interfaz de usuario
with gr.Blocks() as demo:
    chatbot = gr.Chatbot(label="Chat con Gemini")
    chatbot.like(vote, None, None)  # Asociar la función `vote` al botón de like/dislike
    
    gr.ChatInterface(
        fn=response,
        type="messages",
        chatbot=chatbot,
    )

# Lanzar la aplicación
if __name__ == "__main__":
    demo.launch(debug=True, show_error=True)