Spaces:

DeepDiveDev
/

TransformoDocs-Demo

Sleeping

DeepDiveDev commited on Feb 26

Commit

3a8de33

verified ·

1 Parent(s): 9b98135

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,7 @@
-import gradio as gr
 from transformers import TrOCRProcessor, VisionEncoderDecoderModel
 from PIL import Image
 import requests
 # Load your model from Hugging Face
@@ -9,7 +10,11 @@ model = VisionEncoderDecoderModel.from_pretrained("DeepDiveDev/transformodocs-oc
 # Function to extract text
 def extract_text(image):
-    image = Image.open(image).convert("RGB")
     pixel_values = processor(images=image, return_tensors="pt").pixel_values
     generated_ids = model.generate(pixel_values)
     extracted_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]

+import gradio as gr
 from transformers import TrOCRProcessor, VisionEncoderDecoderModel
 from PIL import Image
+import numpy as np
 import requests
 # Load your model from Hugging Face
 # Function to extract text
 def extract_text(image):
+    if isinstance(image, np.ndarray):  # Check if input is a NumPy array
+        image = Image.fromarray(image)  # Convert NumPy array to PIL Image
+    else:
+        image = Image.open(image).convert("RGB")  # Open normally if not a NumPy array
     pixel_values = processor(images=image, return_tensors="pt").pixel_values
     generated_ids = model.generate(pixel_values)
     extracted_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]