test-100

Running

App Files Files Community

Kims12 commited on Mar 19

Commit

c17a6b6

verified ·

1 Parent(s): f41a559

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -39

app.py CHANGED Viewed

@@ -108,8 +108,8 @@ def generate_with_images(prompt, images, max_retries=2):
             logger.info(f"Gemini API 요청 시작 - 프롬프트: {prompt} (시도: {retries+1}/{max_retries+1})")
-            # 이미지 추가 (이미지가 있는 경우만)
-            contents = []
             # 이미지 파트 추가
             for idx, img in enumerate(images, 1):
@@ -120,34 +120,39 @@ def generate_with_images(prompt, images, max_retries=2):
                     image_bytes = buffered.getvalue()
                     # 이미지 파트 생성
-                    contents.append({
-                        'inline_data': {
-                            'mime_type': 'image/png',
-                            'data': image_bytes
                         }
                     })
                     logger.info(f"이미지 #{idx} 추가됨")
             # 텍스트 프롬프트 추가
-            contents.append({
                 'text': prompt
             })
-            # 생성 설정 - 공식 문서에 따라 responseModalities 설정
-            response = client.models.generate_content(
-                model="gemini-2.0-flash-exp-image-generation",
-                contents=contents,
-                config=types.GenerateContentConfig(
-                    response_modalities=['Text', 'Image'],
-                    temperature=1,
-                    top_p=0.95,
-                    top_k=40,
-                    max_output_tokens=8192
-                )
-            )
             # 응답 유효성 확인
-            if not response or not response.candidates:
                 if retries < max_retries:
                     retries += 1
                     logger.warning(f"유효한 응답을 받지 못했습니다. 재시도 중... ({retries}/{max_retries})")
@@ -161,27 +166,21 @@ def generate_with_images(prompt, images, max_retries=2):
                 result_text = ""
                 image_found = False
-                # 응답 처리
-                for candidate in response.candidates:
-                    if not candidate.content:
-                        continue
-                    # 텍스트 추출
-                    if candidate.content.text:
-                        result_text += candidate.content.text
-                        logger.info(f"응답 텍스트: {candidate.content.text}")
-                    # 이미지 추출
-                    for part in candidate.content.parts:
-                        if hasattr(part, 'inline_data') and part.inline_data:
-                            save_binary_file(temp_path, part.inline_data.data)
-                            image_found = True
-                            logger.info("응답에서 이미지 추출 성공")
-                            break
-                    if image_found:
                         break
                 if not image_found:
                     if retries < max_retries:
                         retries += 1

             logger.info(f"Gemini API 요청 시작 - 프롬프트: {prompt} (시도: {retries+1}/{max_retries+1})")
+            # 이미지 및 텍스트 컨텐츠 준비
+            parts = []
             # 이미지 파트 추가
             for idx, img in enumerate(images, 1):
                     image_bytes = buffered.getvalue()
                     # 이미지 파트 생성
+                    parts.append({
+                        'inlineData': {
+                            'mimeType': 'image/png',
+                            'data': base64.b64encode(image_bytes).decode('utf-8')
                         }
                     })
                     logger.info(f"이미지 #{idx} 추가됨")
             # 텍스트 프롬프트 추가
+            parts.append({
                 'text': prompt
             })
+            # 모델 생성 요청
+            request = {
+                'contents': [{
+                    'parts': parts
+                }],
+                'generation_config': {
+                    'temperature': 1.0,
+                    'topP': 0.95,
+                    'topK': 40,
+                    'maxOutputTokens': 8192,
+                    'responseMimeType': 'image/png'
+                }
+            }
+            # 이미지 생성 API 호출
+            model = client.get_model('gemini-pro-vision')
+            response = model.generate_content(request)
             # 응답 유효성 확인
+            if not response or not response.parts:
                 if retries < max_retries:
                     retries += 1
                     logger.warning(f"유효한 응답을 받지 못했습니다. 재시도 중... ({retries}/{max_retries})")
                 result_text = ""
                 image_found = False
+                # 이미지 데이터 확인 및 저장
+                for part in response.parts:
+                    if hasattr(part, 'mime_type') and part.mime_type.startswith('image/'):
+                        # base64 디코딩 및 저장
+                        img_data = base64.b64decode(part.data)
+                        with open(temp_path, 'wb') as f:
+                            f.write(img_data)
+                        image_found = True
+                        logger.info("응답에서 이미지 추출 성공")
                         break
+                # 텍스트 추출 (옵션)
+                if hasattr(response, 'text'):
+                    result_text = response.text
                 if not image_found:
                     if retries < max_retries:
                         retries += 1