logger1

Runtime error

Sanjayraju30 commited on Jun 30

Commit

dd1ae7e

verified ·

1 Parent(s): 5217dbe

Update ocr_engine.py

Files changed (1) hide show

ocr_engine.py CHANGED Viewed

@@ -1,25 +1,28 @@
 from PIL import Image
-from transformers import AutoProcessor, VisionEncoderDecoderModel
 import re
-# Load model fine-tuned for 7-segment displays
-processor = AutoProcessor.from_pretrained("roboflow/ocr-7segment")
-model = VisionEncoderDecoderModel.from_pretrained("roboflow/ocr-7segment")
 def extract_weight(image: Image.Image) -> str:
     image = image.convert("RGB")
-    pixel_values = processor(images=image, return_tensors="pt").pixel_values
-    generated_ids = model.generate(pixel_values)
-    full_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
-    print("OCR Text:", full_text)  # optional debug
-    # Extract number (weight)
-    match = re.search(r"(\d+(\.\d+)?)", full_text)
     weight = match.group(1) if match else None
     # Detect unit
-    text_lower = full_text.lower().replace(" ", "")
     if any(u in text_lower for u in ["kg", "kgs", "kilogram", "kilo"]):
         unit = "kg"
     elif any(u in text_lower for u in ["g", "gram", "grams"]):

+from transformers import DonutProcessor, VisionEncoderDecoderModel
 from PIL import Image
+import torch
 import re
+# Load model
+processor = DonutProcessor.from_pretrained("naver-clova-ix/donut-base-finetuned-cord-v2")
+model = VisionEncoderDecoderModel.from_pretrained("naver-clova-ix/donut-base-finetuned-cord-v2")
 def extract_weight(image: Image.Image) -> str:
     image = image.convert("RGB")
+    pixel_values = processor(image, return_tensors="pt").pixel_values
+    # Generate output
+    outputs = model.generate(pixel_values, max_length=512)
+    decoded = processor.batch_decode(outputs, skip_special_tokens=True)[0]
+    print("OCR Output:", decoded)  # Optional for debug
+    # Extract number
+    match = re.search(r"(\d+(\.\d+)?)", decoded)
     weight = match.group(1) if match else None
     # Detect unit
+    text_lower = decoded.lower().replace(" ", "")
     if any(u in text_lower for u in ["kg", "kgs", "kilogram", "kilo"]):
         unit = "kg"
     elif any(u in text_lower for u in ["g", "gram", "grams"]):