Spaces:

JeCabrera
/

copywriter

Running

App Files Files Community

copywriter / app.py

JeCabrera

Update app.py

f981512 verified 6 months ago

raw

history blame

2.9 kB

	import os
	import time
	import uuid
	from typing import List, Tuple, Optional, Union
	from PIL import Image
	import google.generativeai as genai
	import gradio as gr
	from dotenv import load_dotenv

	# Cargar las variables de entorno desde el archivo .env
	load_dotenv()
	API_KEY = os.getenv("GOOGLE_API_KEY")

	if not API_KEY:
	raise ValueError("La clave de API 'GOOGLE_API_KEY' no está configurada en el archivo .env")

	# Configuración del modelo Gemini
	genai.configure(api_key=API_KEY)
	generation_config = {
	"temperature": 0.7,
	"top_p": 0.9,
	"top_k": 40,
	"max_output_tokens": 8192,
	"response_mime_type": "text/plain",
	}

	model = genai.GenerativeModel(
	model_name="gemini-1.5-flash",
	generation_config=generation_config,
	)

	# Constantes para el manejo de imágenes
	IMAGE_CACHE_DIRECTORY = "/tmp"
	IMAGE_WIDTH = 512
	CHAT_HISTORY = List[Tuple[Optional[Union[Tuple[str], str]], Optional[str]]]

	# Función para preprocesar una imagen
	def preprocess_image(image: Image.Image) -> Optional[Image.Image]:
	"""Redimensiona una imagen manteniendo la relación de aspecto."""
	if image:
	image_height = int(image.height * IMAGE_WIDTH / image.width)
	return image.resize((IMAGE_WIDTH, image_height))

	# Función para almacenar una imagen en caché
	def cache_pil_image(image: Image.Image) -> str:
	"""Guarda la imagen como archivo JPEG en un directorio temporal."""
	image_filename = f"{uuid.uuid4()}.jpeg"
	os.makedirs(IMAGE_CACHE_DIRECTORY, exist_ok=True)
	image_path = os.path.join(IMAGE_CACHE_DIRECTORY, image_filename)
	image.save(image_path, "JPEG")
	return image_path

	# Función principal para manejar las respuestas del chat
	def response(message, history):
	"""Maneja la interacción multimodal y envía texto e imágenes al modelo."""
	text_prompt = message["text"]
	files = message["files"]

	# Procesar imágenes cargadas
	image_prompts = []
	if files:
	for file in files:
	image = Image.open(file).convert('RGB')
	image_preview = preprocess_image(image)
	if image_preview:
	cache_pil_image(image)
	image_prompts.append(image_preview) # Incluir en la lista de prompts

	# Concatenar texto e imágenes para el modelo
	prompts = [text_prompt] + image_prompts
	response = model.generate_content(prompts, stream=True, generation_config=generation_config)

	# Generar respuesta paso a paso
	for chunk in response:
	yield chunk.text

	# Crear la interfaz de usuario
	demo = gr.ChatInterface(
	response,
	examples=[{"text": "Describe the image:", "files": []}],
	multimodal=True,
	textbox=gr.MultimodalTextbox(
	file_count="multiple",
	file_types=["image"],
	sources=["upload", "microphone"],
	),
	)

	# Lanzar la aplicación
	if __name__ == "__main__":
	demo.launch(debug=True, show_error=True)