Replace max_batch_size with batch_size for HybridCache (#3)

- Replace max_batch_size with batch_size for HybridCache (b7d1cc83f04ada2af8339e9e599693a9c494a4d5)

Co-authored-by: Peter Baylies <[email protected]>

Files changed (1) hide show

modeling_ovis.py CHANGED Viewed

@@ -552,14 +552,14 @@ class Ovis(OvisPreTrainedModel):
         self.get_text_tokenizer().save_pretrained(save_directory)
         self.get_visual_tokenizer().get_image_processor().save_pretrained(save_directory)
-    def _get_hybrid_cache_for_llm(self, max_batch_size: int, max_cache_len: int):
         cache_cls = HybridCache
         llm = self.get_llm()
         need_new_cache = (
             not hasattr(llm, "_cache")
             or (not isinstance(llm._cache, cache_cls))
-            or llm._cache.max_batch_size != max_batch_size
             or llm._cache.max_cache_len < max_cache_len
         )
@@ -570,7 +570,7 @@ class Ovis(OvisPreTrainedModel):
                 cache_dtype = llm.dtype
             llm._cache = cache_cls(
                 config=llm.config,
-                max_batch_size=max_batch_size,
                 max_cache_len=max_cache_len,
                 device=llm.device,
                 dtype=cache_dtype,

         self.get_text_tokenizer().save_pretrained(save_directory)
         self.get_visual_tokenizer().get_image_processor().save_pretrained(save_directory)
+    def _get_hybrid_cache_for_llm(self, batch_size: int, max_cache_len: int):
         cache_cls = HybridCache
         llm = self.get_llm()
         need_new_cache = (
             not hasattr(llm, "_cache")
             or (not isinstance(llm._cache, cache_cls))
+            or llm._cache.batch_size != batch_size
             or llm._cache.max_cache_len < max_cache_len
         )
                 cache_dtype = llm.dtype
             llm._cache = cache_cls(
                 config=llm.config,
+                batch_size=batch_size,
                 max_cache_len=max_cache_len,
                 device=llm.device,
                 dtype=cache_dtype,