Spaces:

BenkHel
/

CumoThesis

Running on Zero

BenkHel commited on 15 days ago

Commit

5c45d3a

verified ·

1 Parent(s): 3917c52

Update cumo/model/language_model/llava_llama.py

Files changed (1) hide show

cumo/model/language_model/llava_llama.py CHANGED Viewed

@@ -72,24 +72,25 @@ class LlavaLlamaForCausalLM(LlamaForCausalLM, LlavaMetaForCausalLM):
         if inputs_embeds is None:
             (
-                inputs,
                 position_ids,
                 attention_mask,
-                _,
                 inputs_embeds,
-                _,
                 *_
             ) = self.prepare_inputs_labels_for_multimodal(
-                inputs,
                 position_ids,
                 attention_mask,
-                None,
-                None,
                 images,
-                image_sizes=image_sizes
             )
         return super().forward(
             input_ids=input_ids,
             attention_mask=attention_mask,
@@ -116,25 +117,26 @@ class LlavaLlamaForCausalLM(LlamaForCausalLM, LlavaMetaForCausalLM):
         if "inputs_embeds" in kwargs:
             raise NotImplementedError("`inputs_embeds` is not supported")
-        if images is not None:
             (
-                inputs,
                 position_ids,
                 attention_mask,
-                _,
                 inputs_embeds,
-                _,
                 *_
             ) = self.prepare_inputs_labels_for_multimodal(
-                inputs,
                 position_ids,
                 attention_mask,
-                None,
-                None,
                 images,
-                image_sizes=image_sizes
             )
         else:
             inputs_embeds = self.get_model().embed_tokens(inputs)

         if inputs_embeds is None:
             (
+                input_ids,
                 position_ids,
                 attention_mask,
+                past_key_values,
                 inputs_embeds,
+                labels,
                 *_
             ) = self.prepare_inputs_labels_for_multimodal(
+                input_ids,
                 position_ids,
                 attention_mask,
+                past_key_values,
+                labels,
                 images,
+                image_sizes
             )
         return super().forward(
             input_ids=input_ids,
             attention_mask=attention_mask,
         if "inputs_embeds" in kwargs:
             raise NotImplementedError("`inputs_embeds` is not supported")
+        if inputs_embeds is None:
             (
+                input_ids,
                 position_ids,
                 attention_mask,
+                past_key_values,
                 inputs_embeds,
+                labels,
                 *_
             ) = self.prepare_inputs_labels_for_multimodal(
+                input_ids,
                 position_ids,
                 attention_mask,
+                past_key_values,
+                labels,
                 images,
+                image_sizes
             )
         else:
             inputs_embeds = self.get_model().embed_tokens(inputs)