jadechoghari
/

vfusion3d

feature-extraction

Model card Files Files and versions Community

jadechoghari commited on Aug 2, 2024

Commit

47af768

·

verified ·

1 Parent(s): 95ddb7e

Update modeling.py

Files changed (1) hide show

modeling.py +7 -0

modeling.py CHANGED Viewed

@@ -8,6 +8,7 @@ import torch
 from .dino_wrapper2 import DinoWrapper
 from .transformer import TriplaneTransformer
 from .synthesizer_part import TriplaneSynthesizer
 class CameraEmbedder(nn.Module):
     def __init__(self, raw_dim: int, embed_dim: int):
@@ -46,6 +47,8 @@ class LRMGenerator(PreTrainedModel):
     def __init__(self, config: LRMGeneratorConfig):
         super().__init__(config)
         self.encoder_feat_dim = config.encoder_feat_dim
         self.camera_embed_dim = config.camera_embed_dim
@@ -67,6 +70,10 @@ class LRMGenerator(PreTrainedModel):
         )
     def forward(self, image, camera):
         assert image.shape[0] == camera.shape[0], "Batch size mismatch"
         N = image.shape[0]

 from .dino_wrapper2 import DinoWrapper
 from .transformer import TriplaneTransformer
 from .synthesizer_part import TriplaneSynthesizer
+from .processor import LRMImageProcessor
 class CameraEmbedder(nn.Module):
     def __init__(self, raw_dim: int, embed_dim: int):
     def __init__(self, config: LRMGeneratorConfig):
         super().__init__(config)
+        self.image_processor = LRMImageProcessor(source_size=512)
         self.encoder_feat_dim = config.encoder_feat_dim
         self.camera_embed_dim = config.camera_embed_dim
         )
     def forward(self, image, camera):
+        # we use image processor directly in the forward pass
+        processed_image, source_camera = self.image_processor(image)
         assert image.shape[0] == camera.shape[0], "Batch size mismatch"
         N = image.shape[0]