logger1

Running

File size: 1,192 Bytes

dd1ae7e
65ef5f8
dd1ae7e
d22d28e
65ef5f8
dd1ae7e
 
 
65ef5f8
513f893
 
dd1ae7e
65ef5f8
dd1ae7e
 
 
513f893
dd1ae7e
 
 
 
5217dbe
fb27fac
5217dbe
dd1ae7e
5217dbe
fb27fac
5217dbe
fb27fac
 
5217dbe
fb27fac
5217dbe

from transformers import DonutProcessor, VisionEncoderDecoderModel
from PIL import Image
import torch
import re

# Load model
processor = DonutProcessor.from_pretrained("naver-clova-ix/donut-base-finetuned-cord-v2")
model = VisionEncoderDecoderModel.from_pretrained("naver-clova-ix/donut-base-finetuned-cord-v2")

def extract_weight(image: Image.Image) -> str:
    image = image.convert("RGB")
    pixel_values = processor(image, return_tensors="pt").pixel_values

    # Generate output
    outputs = model.generate(pixel_values, max_length=512)
    decoded = processor.batch_decode(outputs, skip_special_tokens=True)[0]

    print("OCR Output:", decoded)  # Optional for debug

    # Extract number
    match = re.search(r"(\d+(\.\d+)?)", decoded)
    weight = match.group(1) if match else None

    # Detect unit
    text_lower = decoded.lower().replace(" ", "")
    if any(u in text_lower for u in ["kg", "kgs", "kilogram", "kilo"]):
        unit = "kg"
    elif any(u in text_lower for u in ["g", "gram", "grams"]):
        unit = "grams"
    else:
        unit = "kg" if weight and float(weight) >= 5 else "grams"

    return f"{weight} {unit}" if weight else "No valid weight detected"