Spaces:

Mattral
/

Excel-Match-Analysis

Sleeping

Mattral commited on Apr 26, 2024

Commit

1afc11d

verified ·

1 Parent(s): e64bd99

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -59,17 +59,19 @@ def find_exact_matches(df1, df2, column_name):
     return matches
-def find_similar_texts(df1, df2, column_name, threshold=0.8):
-    # Find rows with similar texts in the specified column
     similar_texts = []
     for index1, row1 in df1.iterrows():
         for index2, row2 in df2.iterrows():
-            similarity = SequenceMatcher(None, str(row1[column_name]), str(row2[column_name])).ratio()
-            if similarity >= threshold and index1 != index2:  # Exclude exact matches
-                similar_texts.append((index1, index2, row1[column_name], row2[column_name]))
     return similar_texts
 def main():
     st.title("Item Comparison App")

     return matches
+def find_similar_texts(df1, df2, column_name, exact_matches, threshold=0.8):
+    # Find rows with similar texts in the specified column, excluding exact matches
     similar_texts = []
     for index1, row1 in df1.iterrows():
         for index2, row2 in df2.iterrows():
+            if (index1, index2) not in exact_matches:
+                similarity = SequenceMatcher(None, str(row1[column_name]), str(row2[column_name])).ratio()
+                if similarity >= threshold:
+                    similar_texts.append((index1, index2, row1[column_name], row2[column_name]))
     return similar_texts
 def main():
     st.title("Item Comparison App")