DenseAV

No application file

lorocksUMD commited on Mar 25

Commit

f92d5a0

verified ·

1 Parent(s): a5bd68e

Remove cuda feature requirement

Files changed (1) hide show

app.py CHANGED Viewed

@@ -76,7 +76,8 @@ if __name__ == "__main__":
     def process_video(video, model_option):
-        model = models[model_option].cuda()
         original_frames, audio, info = torchvision.io.read_video(video, end_pts=10, pts_unit='sec')
         sample_rate = 16000
@@ -101,9 +102,11 @@ if __name__ == "__main__":
         frames_to_plot = plotting_img_transform(original_frames.permute(0, 3, 1, 2))
         with torch.no_grad():
-            audio_feats = model.forward_audio({"audio": audio.cuda()})
             audio_feats = {k: v.cpu() for k, v in audio_feats.items()}
-            image_feats = model.forward_image({"frames": frames.unsqueeze(0).cuda()}, max_batch_size=2)
             image_feats = {k: v.cpu() for k, v in image_feats.items()}
             sim_by_head = model.sim_agg.get_pairwise_sims(

     def process_video(video, model_option):
+        # model = models[model_option].cuda()
+        model = models[model_option]
         original_frames, audio, info = torchvision.io.read_video(video, end_pts=10, pts_unit='sec')
         sample_rate = 16000
         frames_to_plot = plotting_img_transform(original_frames.permute(0, 3, 1, 2))
         with torch.no_grad():
+            # audio_feats = model.forward_audio({"audio": audio.cuda()})
+            audio_feats = model.forward_audio({"audio": audio})
             audio_feats = {k: v.cpu() for k, v in audio_feats.items()}
+            # image_feats = model.forward_image({"frames": frames.unsqueeze(0).cuda()}, max_batch_size=2)
+            image_feats = model.forward_image({"frames": frames.unsqueeze(0)}, max_batch_size=2)
             image_feats = {k: v.cpu() for k, v in image_feats.items()}
             sim_by_head = model.sim_agg.get_pairwise_sims(