Spaces:

AIGC-Audio
/

Make_An_Audio

Runtime error

lmzjms commited on May 23, 2023

Commit

a0f9d55

1 Parent(s): c2c1dca

Update ldm/modules/encoders/modules.py

Files changed (1) hide show

ldm/modules/encoders/modules.py CHANGED Viewed

@@ -310,5 +310,42 @@ class FrozenFLANEmbedder(AbstractEncoder):
         z = outputs.last_hidden_state
         return z
     def encode(self, text):
         return self(text)

         z = outputs.last_hidden_state
         return z
+    def encode(self, text):
+        return self(text)
+class FrozenGlobalNormOpenCLIPEmbedder(AbstractEncoder):
+    """
+    Uses the OpenCLIP transformer encoder for text
+    """
+    def __init__(self, arch="ViT-H-14", version="laion2b_s32b_b79k", device="cuda", freeze=True, delvisual=True):
+        super().__init__()
+        model, _, preprocess = open_clip.create_model_and_transforms(arch, device=torch.device('cpu'), pretrained=version)
+        if delvisual:
+            del model.visual
+            del preprocess
+        else:
+            self.preprocess = preprocess
+        self.model = model
+        self.device = device
+        if freeze:
+            self.freeze()
+    def freeze(self):
+        self.model = self.model.eval()
+        for param in self.parameters():
+            param.requires_grad = False
+    def forward(self, text):
+        tokens = open_clip.tokenize(text)
+        z = self.model.encode_text(tokens.to(self.device))
+        z /= z.norm(dim=-1, keepdim=True)
+        return z.unsqueeze(1)
+    def forward_img(self, image):
+        z = self.model.encode_image(image.to(self.device))
+        z /= z.norm(dim=-1, keepdim=True)
+        return z.unsqueeze(1)
     def encode(self, text):
         return self(text)