Spaces:

hujiecpp
/

PE3R

Running on Zero

App Files Files Community

Jie Hu commited on Feb 20

Commit

d17054d

1 Parent(s): 61e5f12

init project

Browse files

Files changed (1) hide show

app.py +7 -3

app.py CHANGED Viewed

@@ -37,10 +37,14 @@ from modules.mobilesamv2.utils.transforms import ResizeLongestSide
 from modules.pe3r.models import Models
 import torchvision.transforms as tvf
 silent = False
 device = 'cuda' if torch.cuda.is_available() else 'cpu'
-pe3r = Models(device)
 def _convert_scene_output_to_glb(outdir, imgs, pts3d, mask, focals, cams2world, cam_size=0.05,
@@ -469,7 +473,7 @@ def get_reconstructed_scene(outdir, filelist, schedule, niter, min_conf_thr,
         scenegraph_type = scenegraph_type + "-" + str(refid)
     pairs = make_pairs(imgs, scene_graph=scenegraph_type, prefilter=None, symmetrize=True)
-    output = inference(pairs, pe3r.mast3r, device, batch_size=1, verbose=not silent)
     mode = GlobalAlignerMode.PointCloudOptimizer if len(imgs) > 2 else GlobalAlignerMode.PairViewer
     scene_1 = global_aligner(output, cog_seg_maps, rev_cog_seg_maps, cog_feats, device=device, mode=mode, verbose=not silent)
     lr = 0.01
@@ -482,7 +486,7 @@ def get_reconstructed_scene(outdir, filelist, schedule, niter, min_conf_thr,
             # print(imgs[i]['img'].shape, scene.imgs[i].shape, ImgNorm(scene.imgs[i])[None])
             imgs[i]['img'] = ImgNorm(scene_1.imgs[i])[None]
         pairs = make_pairs(imgs, scene_graph=scenegraph_type, prefilter=None, symmetrize=True)
-        output = inference(pairs, pe3r.mast3r, device, batch_size=1, verbose=not silent)
         mode = GlobalAlignerMode.PointCloudOptimizer if len(imgs) > 2 else GlobalAlignerMode.PairViewer
         scene = global_aligner(output, cog_seg_maps, rev_cog_seg_maps, cog_feats, device=device, mode=mode, verbose=not silent)
         ori_imgs = scene.ori_imgs

 from modules.pe3r.models import Models
 import torchvision.transforms as tvf
+from modules.mast3r.model import AsymmetricMASt3R
 silent = False
 device = 'cuda' if torch.cuda.is_available() else 'cpu'
+# pe3r = Models(device)
+MAST3R_CKP = 'naver/MASt3R_ViTLarge_BaseDecoder_512_catmlpdpt_metric'
+mast3r = AsymmetricMASt3R.from_pretrained(MAST3R_CKP).to(device)
 def _convert_scene_output_to_glb(outdir, imgs, pts3d, mask, focals, cams2world, cam_size=0.05,
         scenegraph_type = scenegraph_type + "-" + str(refid)
     pairs = make_pairs(imgs, scene_graph=scenegraph_type, prefilter=None, symmetrize=True)
+    output = inference(pairs, mast3r, device, batch_size=1, verbose=not silent)
     mode = GlobalAlignerMode.PointCloudOptimizer if len(imgs) > 2 else GlobalAlignerMode.PairViewer
     scene_1 = global_aligner(output, cog_seg_maps, rev_cog_seg_maps, cog_feats, device=device, mode=mode, verbose=not silent)
     lr = 0.01
             # print(imgs[i]['img'].shape, scene.imgs[i].shape, ImgNorm(scene.imgs[i])[None])
             imgs[i]['img'] = ImgNorm(scene_1.imgs[i])[None]
         pairs = make_pairs(imgs, scene_graph=scenegraph_type, prefilter=None, symmetrize=True)
+        output = inference(pairs, mast3r, device, batch_size=1, verbose=not silent)
         mode = GlobalAlignerMode.PointCloudOptimizer if len(imgs) > 2 else GlobalAlignerMode.PairViewer
         scene = global_aligner(output, cog_seg_maps, rev_cog_seg_maps, cog_feats, device=device, mode=mode, verbose=not silent)
         ori_imgs = scene.ori_imgs