Spaces:

LHRuig
/

trainloraf

Sleeping

LHRuig commited on Jul 3

Commit

bc2f7fd

verified ·

1 Parent(s): dc0e6a4

Delete caption.py

Files changed (1) hide show

caption.py DELETED Viewed

@@ -1,20 +0,0 @@
-from transformers import Blip2Processor, Blip2ForConditionalGeneration
-from PIL import Image
-import torch
-def generate_caption(image_path, trigger_word):
-    processor = Blip2Processor.from_pretrained("Salesforce/blip2-opt-2.7b")
-    model = Blip2ForConditionalGeneration.from_pretrained("Salesforce/blip2-opt-2.7b", torch_dtype=torch.float16)
-    device = "cuda" if torch.cuda.is_available() else "cpu"
-    model.to(device)
-    image = Image.open(image_path)
-    inputs = processor(image, return_tensors="pt").to(device, torch.float16)
-    generated_ids = model.generate(**inputs, max_new_tokens=50)
-    caption = processor.batch_decode(generated_ids, skip_special_tokens=True)[0].strip()
-    return f"a photo of [{trigger_word}], {caption}"
-# Example:
-caption = generate_caption("image.jpg", "my_char")
-print(caption)  # Output: "a photo of [my_char], a woman smiling in a park"