rroset
/

CLIP-ViT-B-32-laion2B-s34B-b79K

Zero-Shot Image Classification

Inference Endpoints

Model card Files Files and versions Community

CLIP-ViT-B-32-laion2B-s34B-b79K / handler.py

rroset's picture

Update handler.py

f3e44e7 verified 4 months ago

1.49 kB

	from transformers import CLIPProcessor, CLIPModel, pipeline
	from PIL import Image
	import requests
	from io import BytesIO
	import base64
	from typing import Dict, List, Any

	class EndpointHandler():
	def __init__(self, path="."):
	# Carrega el model i el processor específics de CLIP
	self.model = CLIPModel.from_pretrained(path)
	self.processor = CLIPProcessor.from_pretrained(path)

	# Crea la pipeline de classificació d'imatges zero-shot
	self.classifier = pipeline("zero-shot-image-classification", model=self.model, tokenizer=self.processor)

	def __call__(self, data: Dict[str, Any]) -> List[Dict[str, Any]]:
	image_input = data.get("inputs", None)
	candidate_labels = data.get("candidate_labels", None)

	if image_input is None or candidate_labels is None:
	raise ValueError("Image input or candidate labels not provided")

	# Determina si l'input és una URL o una cadena base64
	if image_input.startswith("http"):
	response = requests.get(image_input)
	image = Image.open(BytesIO(response.content))
	else:
	# Suposa que l'input és base64 i decodifica-la
	image_data = base64.b64decode(image_input)
	image = Image.open(BytesIO(image_data))

	# Realitza la classificació zero-shot
	results = self.classifier(images=image, candidate_labels=candidate_labels)

	# Torna els resultats processats
	return results