OrionZheng
/

openmoe-base

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

OrionZheng commited on Dec 12, 2023

Commit

ab59aaf

•

1 Parent(s): b021c89

Update modeling_openmoe.py

Files changed (1) hide show

modeling_openmoe.py +1 -1

modeling_openmoe.py CHANGED Viewed

@@ -371,7 +371,7 @@ class OpenMoeAttention(nn.Module):
         value_states = repeat_kv(value_states, self.num_key_value_groups)
         if HAS_FLASH_ATTN and use_kernel:
-            from flash_attn import flash_attn_func
             query_states = query_states.transpose(1, 2)
             key_states = key_states.transpose(1, 2)

         value_states = repeat_kv(value_states, self.num_key_value_groups)
         if HAS_FLASH_ATTN and use_kernel:
+            exec("from flash_attn import flash_attn_func")
             query_states = query_states.transpose(1, 2)
             key_states = key_states.transpose(1, 2)