mychen76
/

mistral7b_ocr_to_json_v1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

mychen76 commited on Oct 7, 2023

Commit

a62fae4

•

1 Parent(s): 2259d9e

Update README.md

Files changed (1) hide show

README.md +23 -0

README.md CHANGED Viewed

@@ -83,6 +83,29 @@ with torch.inference_mode():
     print(result_text)
 ```
 # Load model in 4bits
 ```python

     print(result_text)
 ```
+## Get OCR Image boxes
+```python
+from paddleocr import PaddleOCR, draw_ocr
+from ast import literal_eval
+import json
+paddleocr = PaddleOCR(lang="en",ocr_version="PP-OCRv4",show_log = False,use_gpu=True)
+def paddle_scan(paddleocr,img_path_or_nparray):
+    result = paddleocr.ocr(img_path_or_nparray,cls=True)
+    result = result[0]
+    boxes = [line[0] for line in result]       #boundign box
+    txts = [line[1][0] for line in result]     #raw text
+    scores = [line[1][1] for line in result]   # scores
+    return  txts, result
+# perform ocr scan
+receipt_texts, receipt_boxes = paddle_scan(paddleocr,receipt_image_array)
+print(50*"--","\ntext only:\n",receipt_texts)
+print(50*"--","\nocr boxes:\n",receipt_boxes)
+```
 # Load model in 4bits
 ```python