Spaces:

lym0302
/

DeepSound-V1

Running

lym0302123 commited on Mar 25

Commit

3577d8a

1 Parent(s): dcf3642

mm_audio_tower

Files changed (1) hide show

third_party/VideoLLaMA2/videollama2/model/__init__.py CHANGED Viewed

@@ -52,6 +52,10 @@ VLLMConfigs = {
 def load_pretrained_model(model_path, model_base, model_name, load_8bit=False, load_4bit=False, device_map="auto", device="cuda", use_flash_attn=False, **kwargs):
     if 'token' in kwargs:
         token = kwargs['token']
     else:
@@ -205,4 +209,8 @@ def load_pretrained_model(model_path, model_base, model_name, load_8bit=False, l
     else:
         context_len = 2048
     return tokenizer, model, processor, context_len

 def load_pretrained_model(model_path, model_base, model_name, load_8bit=False, load_4bit=False, device_map="auto", device="cuda", use_flash_attn=False, **kwargs):
+    if hasattr(model.config, "mm_audio_tower"):
+        nname = model.config.mm_audio_tower.split("/")[-1]
+        model.config.mm_audio_tower = os.path.join(model_path, nname)
     if 'token' in kwargs:
         token = kwargs['token']
     else:
     else:
         context_len = 2048
     return tokenizer, model, processor, context_len