Spaces:

Reaumur
/

Captcha

Sleeping

App Files Files Community

Reaumur commited on Nov 6, 2024

Commit

ba61b81

verified ·

1 Parent(s): dfa1dab

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -29

app.py CHANGED Viewed

@@ -46,43 +46,30 @@ characters = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
               'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z']
-# Function to preprocess the image
 def prepare_image(img):
-    # Resize gambar sesuai dengan ukuran yang diharapkan oleh model
-    img = img.resize((img_width, img_height))  # Resize to (200, 50)
-    # Konversi gambar ke array
-    img_array = img_to_array(img)
-    # Tambahkan dimensi untuk batch (menjadi 1, 50, 200) dan reshape ke bentuk (1, 50, 200, 1)
-    img_array = np.expand_dims(img_array, axis=0)  # Tambahkan dimensi untuk batch
-    img_array = np.transpose(img_array, (0, 2, 1, 3))  # Mengubah urutan dimensi menjadi (1, 200, 50, 1)
-    # Menyusun input_length dan label_length untuk model OCR
-    input_length = np.ones((img_array.shape[0], 1)) * (img_width // 4)  # Sesuaikan dengan input panjang
-    label_length = np.ones((img_array.shape[0], 1)) * max_length  # Example label length
-    # Menambahkan input dummy untuk label (jika perlu untuk prediksi)
-    dummy_label = np.zeros((img_array.shape[0], max_length))  # Input dummy jika model mengharapkan label input
-    # Melakukan prediksi
-    preds = model.predict([img_array, input_length, label_length, dummy_label])  # Berikan 4 input
-    pred_texts = decode_batch_predictions(preds)
-    return pred_texts, preds
 def decode_batch_predictions(pred):
     pred_texts = []
-    # Loop untuk setiap batch (jika ada lebih dari satu batch)
     for i in range(pred.shape[0]):
-        # Ambil argmax untuk mendapatkan indeks karakter yang diprediksi (yaitu karakter yang paling mungkin)
-        pred_indices = np.argmax(pred[i], axis=-1)  # Cari indeks dengan probabilitas tertinggi
-        # Sekarang kita memetakan indeks ini ke karakter, mengecualikan nilai yang tidak valid seperti -1 atau 0 (padding)
-        pred_text = ''.join([characters[int(c)] for c in pred_indices if c != -1 and c != 0])
-        pred_texts.append(pred_text)  # Simpan teks hasil decoding untuk batch yang sedang diproses
     return pred_texts

               'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z']
+# Preprocessing gambar untuk memastikan bahwa gambar sesuai dengan input yang diinginkan
 def prepare_image(img):
+    # Resize gambar ke ukuran yang diinginkan
+    img = img.resize((img_width, img_height))
+    # Konversi ke array dan normalisasi gambar
+    img_array = img_to_array(img) / 255.0  # Normalisasi
+    # Tambahkan dimensi batch dan sesuaikan dengan dimensi yang diinginkan model
+    img_array = np.expand_dims(img_array, axis=0)  # Batch size 1
+    img_array = np.transpose(img_array, (0, 2, 1, 3))  # Untuk model dengan dimensi (batch, width, height, channels)
+    return img_array
 def decode_batch_predictions(pred):
     pred_texts = []
+    # Loop untuk setiap prediksi dalam batch
     for i in range(pred.shape[0]):
+        # Mengambil argmax untuk mendapatkan indeks dengan probabilitas tertinggi
+        pred_indices = np.argmax(pred[i], axis=-1)  # Ambil argmax untuk setiap karakter
+        # Memetakan indeks ke karakter (mengecualikan padding dan placeholder)
+        pred_text = ''.join([characters[int(c)] for c in pred_indices if c not in [-1, 0]])
+        # Menambahkan hasil teks untuk batch ke pred_texts
+        pred_texts.append(pred_text)
     return pred_texts