Spaces:

vishnun
/

CLIPnCROP

Running

vishnun commited on Dec 26, 2021

Commit

9a541ed

1 Parent(s): 1e53e47

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,9 +16,6 @@ o1 = gr.outputs.Image()
 o2 = gr.outputs.Textbox()
 def extract_image(image, text, num=1):
-    feature_extractor = DetrFeatureExtractor.from_pretrained('facebook/detr-resnet-50')
-    dmodel = DetrForObjectDetection.from_pretrained('facebook/detr-resnet-50')
     inputs = feature_extractor(images=image, return_tensors="pt")
     outputs = dmodel(**inputs)
@@ -48,9 +45,9 @@ def extract_image(image, text, num=1):
       images_list.append(roi_im)
-    inputs = processor(text = [text], images=images_list , return_tensors="pt", padding=True)
-    outputs = model(**inputs)
-    logits_per_image = outputs.logits_per_text
     probs = logits_per_image.softmax(-1)
     l_idx = np.argsort(probs[-1].detach().numpy())[::-1][0:num]

 o2 = gr.outputs.Textbox()
 def extract_image(image, text, num=1):
     inputs = feature_extractor(images=image, return_tensors="pt")
     outputs = dmodel(**inputs)
       images_list.append(roi_im)
+    inpu = processor(text = [text], images=images_list , return_tensors="pt", padding=True)
+    output = model(**inpu)
+    logits_per_image = output.logits_per_text
     probs = logits_per_image.softmax(-1)
     l_idx = np.argsort(probs[-1].detach().numpy())[::-1][0:num]