Spaces:

JeCabrera
/

copywriter

Running

App Files Files Community

JeCabrera commited on Jan 17

Commit

4cca355

verified ·

1 Parent(s): f53c211

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -10

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ import google.generativeai as genai
 import os
 from pypdf import PdfReader
-# Reemplaza con tu clave de API de Gemini
 GOOGLE_API_KEY = os.environ.get("GOOGLE_API_KEY")
 if not GOOGLE_API_KEY:
     raise ValueError("La variable de entorno GOOGLE_API_KEY no está definida.")
@@ -37,20 +37,21 @@ def process_input(instruction, text_file, pdf_file, image_file):
         prompt_parts.append(f"Contenido del archivo PDF:\n{file_content}")
     if image_file:
-        # Aquí debes trabajar con la API de imágenes
-        image_data = image_file  # Usamos directamente la imagen cargada
-        response = genai.ImageGeneration.create(
-            model="gemini-1.5-flash",  # Usamos siempre el modelo correcto
-            image=image_data
         )
-        return response['image']  # Asumiendo que la respuesta devuelve una imagen procesada
     if prompt_parts:
         prompt = "\n\n".join(prompt_parts)
         response = genai.ChatCompletion.create(
-            model="gemini-1.5-flash",  # Usamos siempre el modelo correcto
             messages=[{"role": "user", "content": prompt}],
-            max_tokens=8192  # Cambié a 8192 tokens
         )
         return response['choices'][0]['message']['content']
     else:
@@ -62,7 +63,7 @@ iface = gr.Interface(
         gr.Textbox(label="Instrucciones"),
         gr.File(label="Archivo de Texto (.txt)"),
         gr.File(label="Archivo PDF (.pdf)"),
-        gr.Image(label="Imagen", type="file"),  # Cambié el tipo de 'image' a 'file'
     ],
     outputs=gr.Textbox(label="Respuesta de Gemini"),
     title="Interactúa con Gemini",

 import os
 from pypdf import PdfReader
+# Cargar la clave API desde el entorno
 GOOGLE_API_KEY = os.environ.get("GOOGLE_API_KEY")
 if not GOOGLE_API_KEY:
     raise ValueError("La variable de entorno GOOGLE_API_KEY no está definida.")
         prompt_parts.append(f"Contenido del archivo PDF:\n{file_content}")
     if image_file:
+        # Para el modelo vision, necesitas pasar la imagen como datos
+        prompt_parts.append(f"Imagen: {image_file.name}")
+        response = genai.ChatCompletion.create(
+            model="gemini-1.5-flash",
+            messages=[{"role": "user", "content": "Contenido de la imagen: " + image_file.name}],
+            max_tokens=8192,
         )
+        return response['choices'][0]['message']['content']
     if prompt_parts:
         prompt = "\n\n".join(prompt_parts)
         response = genai.ChatCompletion.create(
+            model="gemini-1.5-flash",
             messages=[{"role": "user", "content": prompt}],
+            max_tokens=8192,
         )
         return response['choices'][0]['message']['content']
     else:
         gr.Textbox(label="Instrucciones"),
         gr.File(label="Archivo de Texto (.txt)"),
         gr.File(label="Archivo PDF (.pdf)"),
+        gr.Image(label="Imagen", type="filepath"),  # Cambié el tipo a 'filepath'
     ],
     outputs=gr.Textbox(label="Respuesta de Gemini"),
     title="Interactúa con Gemini",