logger2

Running

File size: 1,171 Bytes

1dbcf19
2f21856
1dbcf19
17d218a
65ef5f8
83f2f91
1dbcf19
 
65ef5f8
25cb585
83f2f91
 
 
 
25cb585
 
1dbcf19
 
 
 
25cb585
 
83f2f91
1dbcf19
83f2f91
 
1dbcf19
83f2f91
1dbcf19
83f2f91
1dbcf19

from transformers import TrOCRProcessor, VisionEncoderDecoderModel
from PIL import Image
import torch
import re

# Load TrOCR once
processor = TrOCRProcessor.from_pretrained("microsoft/trocr-base-handwritten")
model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-base-handwritten")

def clean_ocr_text(text):
    print("[RAW OCR]", text)
    text = text.replace(",", ".").replace("s", "5").replace("o", "0").lower()
    text = re.sub(r"[^\d\.kg]", "", text)  # Keep only digits, dot, k, g
    print("[CLEANED OCR]", text)
    return text

def extract_weight(image):
    try:
        pixel_values = processor(images=image, return_tensors="pt").pixel_values
        generated_ids = model.generate(pixel_values)
        raw_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0].strip()

        cleaned = clean_ocr_text(raw_text)

        # Regex for weight
        match = re.search(r'(\d{1,5}(?:\.\d{1,3})?)\s*(kg|g)', cleaned)
        if match:
            return f"{match.group(1)} {match.group(2)}"
        else:
            return f"No valid weight found | OCR: {cleaned}"
    except Exception as e:
        return f"Error: {str(e)}"