Crystalcareai
/

Quiet-Star-Custom

Text Generation

Model card Files Files and versions Community

Crystalcareai commited on Mar 26, 2024

Commit

695a26f

·

verified ·

1 Parent(s): 7a973a6

Update modeling_quiet.py

Files changed (1) hide show

modeling_quiet.py +6 -0

modeling_quiet.py CHANGED Viewed

@@ -719,6 +719,12 @@ class QuietSdpaAttention(QuietAttention):
             key_states = key_states.contiguous()
             value_states = value_states.contiguous()
         attn_output = torch.nn.functional.scaled_dot_product_attention(
             query_states,
             key_states,

             key_states = key_states.contiguous()
             value_states = value_states.contiguous()
+        # Cast query_states, key_states, and value_states to the same data type as attention_mask
+        query_states = query_states.to(attention_mask.dtype)
+        key_states = key_states.to(attention_mask.dtype)
+        value_states = value_states.to(attention_mask.dtype)
         attn_output = torch.nn.functional.scaled_dot_product_attention(
             query_states,
             key_states,