nnpy
/

blip-image-captioning

image-text-to-text

Inference Endpoints

Model card Files Files and versions Community

blip-image-captioning / README.md

prasanna2003's picture

Update README.md

9e192f4 over 1 year ago

|

history blame contribute delete

737 Bytes

	---
	pipeline_tag: image-to-text
	datasets:
	- MMInstruction/M3IT
	---

	## Usage:
	```
	from transformers import BlipProcessor, BlipForConditionalGeneration
	import torch
	from PIL import Image

	processor = BlipProcessor.from_pretrained("prasanna2003/blip-image-captioning")
	if processor.tokenizer.eos_token is None:
	processor.tokenizer.eos_token = '<\|eos\|>'
	model = BlipForConditionalGeneration.from_pretrained("prasanna2003/blip-image-captioning")

	image = Image.open('file_name.jpg').convert('RGB')

	prompt = """Instruction: Generate a single line caption of the Image.
	output: """

	inputs = processor(image, prompt, return_tensors="pt")

	output = model.generate(**inputs, max_length=100)
	print(processor.tokenizer.decode(output[0]))

	```