Spaces:

sibthinon
/

environment

Sleeping

App Files Files Community

sibthinon commited on Jun 17

Commit

4ccade9

verified ·

1 Parent(s): 7a2742e

fix rapidfuzz partial ratio

Browse files

Files changed (1) hide show

app.py +12 -8

app.py CHANGED Viewed

@@ -6,7 +6,6 @@ from qdrant_client import QdrantClient
 from qdrant_client.models import Filter, FieldCondition, MatchValue
 import os
 from rapidfuzz import fuzz
-from pythainlp.tokenize import word_tokenize
 from pyairtable import Table
 from pyairtable import Api
 import re
@@ -73,15 +72,20 @@ def search_product(query):
       scored = []
       for r in result:
           name = r.payload.get("name", "")
           # ถ้า query สั้นเกินไป ให้ fuzzy_score = 0 เพื่อกันเพี้ยน
           if len(corrected_query) >= 3 and name:
-              fuzzy_score = fuzz.partial_ratio(corrected_query, name) / 100.0
           else:
-              fuzzy_score = 0.0
           # รวม hybrid score
-          hybrid_score = 0.6 * r.score + 0.4 * fuzzy_score
           scored.append((r, hybrid_score))
       # เรียงตาม hybrid score แล้วกรองผลลัพธ์ที่ hybrid score ต่ำเกิน
@@ -96,10 +100,10 @@ def search_product(query):
     result_summary, found = "", False
     for res in result:
-        if res.score >= threshold:
             found = True
             name = res.payload.get("name", "ไม่ทราบชื่อสินค้า")
-            score = f"{res.score:.4f}"
             img_url = res.payload.get("imageUrl", "")
             price = res.payload.get("price", "ไม่ระบุ")
             brand = res.payload.get("brand", "")

 from qdrant_client.models import Filter, FieldCondition, MatchValue
 import os
 from rapidfuzz import fuzz
 from pyairtable import Table
 from pyairtable import Api
 import re
       scored = []
       for r in result:
           name = r.payload.get("name", "")
           # ถ้า query สั้นเกินไป ให้ fuzzy_score = 0 เพื่อกันเพี้ยน
           if len(corrected_query) >= 3 and name:
+            fuzzy_score = fuzz.partial_ratio(corrected_query, name) / 100.0
           else:
+            fuzzy_score = 0.0
           # รวม hybrid score
+          if fuzzy_score < 0.5:
+            hybrid_score = r.score
+          else:
+            hybrid_score = 0.7 * r.score + 0.3 * fuzzy_score
+          r.payload["score"] = hybrid_score  # เก็บลง payload ใช้เทียบ treshold ตอนเเสดงผล
+          r.payload["fuzzy_score"] = fuzzy_score # เก็บไว้เผื่อ debug
+          r.payload['semantic_score'] = r.score # เก็บไว้เผื่อ debug
           scored.append((r, hybrid_score))
       # เรียงตาม hybrid score แล้วกรองผลลัพธ์ที่ hybrid score ต่ำเกิน
     result_summary, found = "", False
     for res in result:
+        if res.payload["score"] >= threshold:
             found = True
             name = res.payload.get("name", "ไม่ทราบชื่อสินค้า")
+            score = f"{res.payload['score']:.4f}"
             img_url = res.payload.get("imageUrl", "")
             price = res.payload.get("price", "ไม่ระบุ")
             brand = res.payload.get("brand", "")