Spaces:

sneedium
/

dvatch_captcha_sneedium

Runtime error

App Files Files Community

sneedium commited on Sep 28, 2022

Commit

653f12c

1 Parent(s): cb0ed46

Update app.py

Browse files

Files changed (1) hide show

app.py +3 -30

app.py CHANGED Viewed

@@ -4,39 +4,12 @@ os.system("curl -L -o tensor.pt https://seyarabata.com/btfo_by_24mb_model")
 import torch
 from PIL import Image
 import gradio as gr
-from torchvision import transforms as T
-from typing import Tuple
-def rand_augment_transform(magnitude=5, num_layers=3):
-    # These are tuned for magnitude=5, which means that effective magnitudes are half of these values.
-    hparams = {
-        'rotate_deg': 30,
-        'shear_x_pct': 0.9,
-        'shear_y_pct': 0.2,
-        'translate_x_pct': 0.10,
-        'translate_y_pct': 0.30
-    }
-    ra_ops = auto_augment.rand_augment_ops(magnitude, hparams, transforms=_RAND_TRANSFORMS)
-    # Supply weights to disable replacement in random selection (i.e. avoid applying the same op twice)
-    choice_weights = [1. / len(ra_ops) for _ in range(len(ra_ops))]
-    return auto_augment.RandAugment(ra_ops, num_layers, choice_weights)
-def get_transform(img_size: Tuple[int], augment: bool = False, rotation: int = 0):
-    transforms = []
-    if augment:
-        transforms.append(rand_augment_transform())
-    if rotation:
-        transforms.append(lambda img: img.rotate(rotation, expand=True))
-    transforms.extend([
-        T.Resize(img_size, T.InterpolationMode.BICUBIC),
-        T.ToTensor(),
-        T.Normalize(0.5, 0.5)
-    ])
-    return T.Compose(transforms)
 parseq = torch.load('tensor.pt', map_location=torch.device('cpu')).eval()
-img_transform = get_transform(parseq.hparams.img_size)
 def captcha_solver(img):
   img = img.convert('RGB')

 import torch
 from PIL import Image
 import gradio as gr
+from strhub.data.module import SceneTextDataModule
+from strhub.models.utils import load_from_checkpoint, parse_model_args
 parseq = torch.load('tensor.pt', map_location=torch.device('cpu')).eval()
+img_transform = SceneTextDataModule.get_transform(parseq.hparams.img_size)
 def captcha_solver(img):
   img = img.convert('RGB')