LayoutLMv3_for_recepits2

Sleeping

mp-02 commited on Oct 21, 2024

Commit

a3a5528

verified ·

1 Parent(s): 0f12594

Update inference.py

Files changed (1) hide show

inference.py CHANGED Viewed

@@ -16,23 +16,6 @@ model.to(device)
 import json
-boxes, words = OCR(image)
-# Preprocessa l'immagine e il testo con il processore di LayoutLMv3
-encoding = processor(image, words=words, boxes=boxes, return_tensors="pt", padding="max_length", truncation=True)
-# Esegui l'inferenza con il modello fine-tuned
-with torch.no_grad():
-    outputs = model(**encoding)
-# Ottieni le etichette previste dal modello
-logits = outputs.logits
-predicted_ids = logits.argmax(-1).squeeze().tolist()
-predictions = outputs.logits.argmax(-1).squeeze().tolist()
-token_boxes = encoding.bbox.squeeze().tolist()
-probabilities = torch.softmax(outputs.logits, dim=-1)
-confidence_scores = probabilities.max(-1).values.squeeze().tolist()
 # Mappa gli ID predetti nelle etichette di classificazione
 labels = processor.tokenizer.convert_ids_to_tokens(predicted_ids)
@@ -53,12 +36,30 @@ def create_json_output(words, labels, boxes):
     json_output = json.dumps(output, indent=4)
     return json_output
-# Crea il JSON usando i risultati ottenuti
-json_result = create_json_output(words, labels, boxes)
-for prediction, box, confidence in zip(true_predictions, true_boxes, true_confidence_scores):
-        draw.rectangle(box)
-        draw.text((box[0]+10, box[1]-10), text=prediction+ ", "+ str(confidence), font=font, fill="black", font_size="15")
-return image, json_result

 import json
 # Mappa gli ID predetti nelle etichette di classificazione
 labels = processor.tokenizer.convert_ids_to_tokens(predicted_ids)
     json_output = json.dumps(output, indent=4)
     return json_output
+def prediction()
+    boxes, words = OCR(image)
+    # Preprocessa l'immagine e il testo con il processore di LayoutLMv3
+    encoding = processor(image, words=words, boxes=boxes, return_tensors="pt", padding="max_length", truncation=True)
+    # Esegui l'inferenza con il modello fine-tuned
+    with torch.no_grad():
+        outputs = model(**encoding)
+    # Ottieni le etichette previste dal modello
+    logits = outputs.logits
+    predicted_ids = logits.argmax(-1).squeeze().tolist()
+    predictions = outputs.logits.argmax(-1).squeeze().tolist()
+    token_boxes = encoding.bbox.squeeze().tolist()
+    probabilities = torch.softmax(outputs.logits, dim=-1)
+    confidence_scores = probabilities.max(-1).values.squeeze().tolist()
+    # Crea il JSON usando i risultati ottenuti
+    json_result = create_json_output(words, labels, boxes)
+    for prediction, box, confidence in zip(true_predictions, true_boxes, true_confidence_scores):
+            draw.rectangle(box)
+            draw.text((box[0]+10, box[1]-10), text=prediction+ ", "+ str(confidence), font=font, fill="black", font_size="15")
+    return image, json_result