Spaces:

Hasani
/

Binary-Image-Classification-In-The-Wild

Runtime error

IbrahimHasani commited on Sep 8, 2023

Commit

22ae21c

1 Parent(s): f201a9c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,19 +1,15 @@
 from PIL import Image
 from transformers import CLIPProcessor, CLIPModel
-from io import BytesIO
 import gradio as gr
 # Initialize CLIP model and processor
 processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch16")
 model = CLIPModel.from_pretrained("openai/clip-vit-base-patch16")
-def image_similarity(image: Image.Image, action_prompt: str):
-    positive_text = f"a person {action_prompt}"
-    negative_text = f"a person not {action_prompt}"
     inputs = processor(
-        text=[positive_text, negative_text],
         images=image,
         return_tensors="pt",
         padding=True
@@ -31,17 +27,18 @@ interface = gr.Interface(
     fn=image_similarity,
     inputs=[
         gr.components.Image(type="pil"),
-        gr.components.Text(label="Enter action prompt e.g. 'smiling'")
     ],
     outputs=[
         gr.components.Textbox(label="Result"),
         gr.components.Textbox(label="Probabilities")
     ],
     title="Engagify's Image Action Detection",
-    description="[Author: Ibrahim Hasani] This Method uses CLIP-VIT [Version: BASE-PATCH-16] to determine if an action is being performed in a image or not. (Binaray Classifier). It contrasts an Action against multiple negative labels that are supposedly far enough in the latent semantic space vs the target label. Do not use negative labels in the desired activity, rather the action to be performed.",
     live=False,
     theme=gr.themes.Monochrome(),
 )
-interface.launch()

 from PIL import Image
 from transformers import CLIPProcessor, CLIPModel
 import gradio as gr
 # Initialize CLIP model and processor
 processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch16")
 model = CLIPModel.from_pretrained("openai/clip-vit-base-patch16")
+def image_similarity(image: Image.Image, positive_prompt: str, negative_prompt: str):
     inputs = processor(
+        text=[positive_prompt, negative_prompt],
         images=image,
         return_tensors="pt",
         padding=True
     fn=image_similarity,
     inputs=[
         gr.components.Image(type="pil"),
+        gr.components.Text(label="Enter positive prompt e.g. 'a smiling face'"),
+        gr.components.Text(label="Enter negative prompt e.g. 'a sad face'")
     ],
     outputs=[
         gr.components.Textbox(label="Result"),
         gr.components.Textbox(label="Probabilities")
     ],
     title="Engagify's Image Action Detection",
+    description="[Author: Ibrahim Hasani] This Method uses CLIP-VIT [Version: BASE-PATCH-16] to determine if an action is being performed in a image or not. (Binaray Classifier). It contrasts an Action against a negative label. Ensure the prompts accurately describe the desired detection.",
     live=False,
     theme=gr.themes.Monochrome(),
 )
+interface.launch()