Spaces:

Chanjeans
/

vector

Sleeping

App Files Files Community

Chanjeans commited on Feb 22

Commit

4889d86

verified ·

1 Parent(s): 30d3745

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -30

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from sentence_transformers import SentenceTransformer
 import os
-from typing import Optional, List
 #####################################
@@ -1026,71 +1026,65 @@ def cosine_similarity(vec1, vec2):
         return 0.0
     return float(np.dot(vec1, vec2) / (norm1 * norm2))
-def recommend_content_based(user_profile, top_n=5):
     user_emb = get_user_embedding(user_profile)
     scored = []
-    # 🟢 다중 취미/세부취미를 리스트로 가정
     user_hobbies = user_profile.get("hobby", []) or []
     user_details = user_profile.get("detail_hobby", []) or []
     user_extroversion = user_profile.get("extroversion", "")
     user_feeling_thinking = user_profile.get("feeling_thinking", "")
-    hobby_count = {hobby: 0 for hobby in user_hobbies}  # 취미별 추천 개수 제한
     for item in items:
         item_id = item["item_id"]
         item_emb = item_embedding_dict[item_id]
         sim = cosine_similarity(user_emb, item_emb)
         # 기본 가중치
         weight = 1.0
-        # (1) 취미 가중치 (독서 쏠림 방지)
         desc_hobby = extract_hobby(item["desc"])  # 예: "(운동, 헬스)"
         for h in user_hobbies:
             if h in desc_hobby:
-                weight *= 1.1  # 기본 가중치 1.1배
-                hobby_count[h] += 1
         for dh in user_details:
             if dh in desc_hobby:
-                weight *= 1.3  # 세부 취미는 1.3배 가중치
-        # (2) 성향 (외향/내향, 감정/이성)
         personality_match_count = sum(
             trait in item["personality"]
             for trait in [user_extroversion, user_feeling_thinking]
         )
         if personality_match_count == 1:
-            weight *= 1.15
         elif personality_match_count == 2:
-            weight *= 1.25
         final_score = sim * weight
         scored.append((item, final_score))
-    # 점수가 높은 순으로 정렬
     scored.sort(key=lambda x: x[1], reverse=True)
-    # 🟢 특정 취미(예: 독서)가 과하게 나오는 문제 해결 (최대 2개 제한)
-    balanced_recommendations = []
-    hobby_limits = {hobby: 2 for hobby in user_hobbies}  # 각 취미별 최대 추천 개수 제한
-    for item, score in scored:
-        item_hobby = extract_hobby(item["desc"])  # "(독서, 소설)" → "독서, 소설"
-        item_main_hobby = item_hobby.split(", ")[0] if item_hobby else None
-        # 특정 취미가 이미 너무 많다면 스킵
-        if item_main_hobby and hobby_limits.get(item_main_hobby, 0) > 0:
-            balanced_recommendations.append((item, score))
-            hobby_limits[item_main_hobby] -= 1
-        # 추천 개수가 충분히 채워질 때까지 계속 추천
-        if len(balanced_recommendations) >= top_n:
             break
     # 추천 개수가 부족하다면, 나머지 추천을 추가
     if len(balanced_recommendations) < top_n:

 from pydantic import BaseModel
 from sentence_transformers import SentenceTransformer
 import os
+from typing import Optional, List,Dict
 #####################################
         return 0.0
     return float(np.dot(vec1, vec2) / (norm1 * norm2))
+def recommend_content_based(user_profile: dict, top_n=5):
     user_emb = get_user_embedding(user_profile)
     scored = []
+    seen_items = set()  # 중복 방지를 위한 집합
+    # 🟢 다중 취미/세부취미 지원
     user_hobbies = user_profile.get("hobby", []) or []
     user_details = user_profile.get("detail_hobby", []) or []
     user_extroversion = user_profile.get("extroversion", "")
     user_feeling_thinking = user_profile.get("feeling_thinking", "")
     for item in items:
         item_id = item["item_id"]
+        if item_id in seen_items:  # 중복 방지
+            continue
         item_emb = item_embedding_dict[item_id]
         sim = cosine_similarity(user_emb, item_emb)
         # 기본 가중치
         weight = 1.0
+        # (1) 취미 가중치
         desc_hobby = extract_hobby(item["desc"])  # 예: "(운동, 헬스)"
         for h in user_hobbies:
             if h in desc_hobby:
+                weight *= 1.15
+        # (2) 세부 취미 가중치
         for dh in user_details:
             if dh in desc_hobby:
+                weight *= 1.3
+        # (3) 성향 가중치 (외향형/내향형, 감정형/이성형)
         personality_match_count = sum(
             trait in item["personality"]
             for trait in [user_extroversion, user_feeling_thinking]
         )
         if personality_match_count == 1:
+            weight *= 1.2
         elif personality_match_count == 2:
+            weight *= 1.3
         final_score = sim * weight
         scored.append((item, final_score))
+    # 🟢 점수가 높은 순으로 정렬
     scored.sort(key=lambda x: x[1], reverse=True)
+    # 🟢 상위 5개를 확보 (중복 없이)
+    selected_items = []
+    for (item, score) in scored:
+        if len(selected_items) >= top_n:
             break
+        if item["item_id"] not in seen_items:
+            seen_items.add(item["item_id"])
+            selected_items.append((item, score))
+    return selected_items
     # 추천 개수가 부족하다면, 나머지 추천을 추가
     if len(balanced_recommendations) < top_n: