Spaces:

ktllc
/

Clip-Model-InputBase64

Sleeping

ktllc commited on Oct 19, 2023

Commit

ad91d57

1 Parent(s): 2b19e7c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,24 +23,22 @@ def find_similarity(base64_image, text_input):
     # Preprocess the image
     image = preprocess(image).unsqueeze(0).to(device)
-    # Tokenize the text input
     text_tokens = clip.tokenize([text_input]).to(device)
     # Encode image and text features
-    with torch no grad():
-        image_features = model.encode_image(image)
-        text_features = model.encode_text(text_tokens)
-    # Calculate cosine similarity
-    similarity = (image_features @ text_features.T).squeeze(0).cpu().numpy()
-    # Convert each element in the similarity array to Decimal
-    similarity_decimal = [Decimal(float(score)) for score in similarity]
-    # Format Decimal values as floats with specific precision (e.g., 4 decimal places)
-    formatted_similarity = [f'{float(score):.5f}' for score in similarity_decimal]
-    return formatted_similarity
 # Create a Gradio interface
 iface = gr.Interface(

     # Preprocess the image
     image = preprocess(image).unsqueeze(0).to(device)
+    # Prepare input text
     text_tokens = clip.tokenize([text_input]).to(device)
     # Encode image and text features
+    with torch.no_grad():
+        image_features = model.encode_image(image)
+        text_features = model.encode_text(text_tokens)
+    # Normalize features and calculate similarity
+    image_features /= image_features.norm(dim=-1, keepdim=True)
+    text_features /= text_features.norm(dim=-1, keepdim=True)
+    similarity = (text_features @ image_features.T).squeeze(0).cpu().numpy()
+    return similarity[0, 0]
 # Create a Gradio interface
 iface = gr.Interface(