logger1

Running

File size: 1,403 Bytes

d754b04
5d38db5
d22d28e
65ef5f8
52e7bf6
91ebd46
 
65ef5f8
513f893
52e7bf6
 
 
 
 
5d38db5
52e7bf6
 
d754b04
 
65ef5f8
52e7bf6
 
 
 
d754b04
a4b646d
5217dbe
fb27fac
52e7bf6
a4b646d
fb27fac
a4b646d
fb27fac
 
5d38db5
fb27fac
52e7bf6

from transformers import TrOCRProcessor, VisionEncoderDecoderModel
from PIL import Image, ImageEnhance
import re

# Load OCR model
processor = TrOCRProcessor.from_pretrained("microsoft/trocr-base-handwritten")
model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-base-handwritten")

def extract_weight(image: Image.Image) -> str:
    # Step 1: Enhance image
    image = image.convert("L")  # grayscale
    image = ImageEnhance.Contrast(image).enhance(2.0)
    image = ImageEnhance.Sharpness(image).enhance(2.5)
    image = image.convert("RGB")

    # Step 2: Run OCR
    pixel_values = processor(images=image, return_tensors="pt").pixel_values
    generated_ids = model.generate(pixel_values, max_length=32)
    full_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]

    # Debug
    print("OCR Output:", full_text)

    # Step 3: Extract number
    cleaned = full_text.lower().replace(" ", "")
    match = re.search(r"(\d+(\.\d+)?)", cleaned)
    weight = match.group(1) if match else None

    # Step 4: Detect unit based on actual OCR text
    if any(u in cleaned for u in ["kg", "kgs", "kilogram", "kilo"]):
        unit = "kg"
    elif any(u in cleaned for u in ["g", "gram", "grams"]):
        unit = "grams"
    else:
        unit = "kg" if weight and float(weight) >= 20 else "grams"

    return f"{weight} {unit}" if weight else "No valid weight detected"