Crystalcareai
/

Quiet-Star-Custom

Text Generation

Model card Files Files and versions

Crystalcareai commited on Mar 26, 2024

Commit

66b0a6e

·

verified ·

1 Parent(s): 833b955

Update modeling_quiet.py

Files changed (1) hide show

modeling_quiet.py +2 -11

modeling_quiet.py CHANGED Viewed

@@ -1072,16 +1072,7 @@ class QuietModel(QuietPreTrainedModel):
                 )
         if attention_mask is None:
-            if input_ids is not None:
-                attention_mask = torch.ones_like(input_ids, dtype=torch.bool)
-            elif inputs_embeds is not None:
-                attention_mask = torch.ones(
-                    (batch_size, seq_len),
-                    dtype=torch.bool,
-                    device=inputs_embeds.device
-                )
-            else:
-                raise ValueError("Either input_ids or inputs_embeds should be provided.")
         if attention_mask.dim() == 2:
             attention_mask = attention_mask.view(batch_size, 1, 1, seq_len)
@@ -1091,7 +1082,7 @@ class QuietModel(QuietPreTrainedModel):
         elif attention_mask.dim() != 4:
             raise ValueError(f"Attention mask should be of shape (batch_size, 1, seq_len, seq_len) or (batch_size, 1, 1, seq_len), but got {attention_mask.shape}")
-        attention_mask = attention_mask.to(dtype=torch.bool, device=input_ids.device)
         hidden_states = inputs_embeds

                 )
         if attention_mask is None:
+            attention_mask = torch.ones((batch_size, seq_len), dtype=torch.bool, device=inputs_embeds.device)
         if attention_mask.dim() == 2:
             attention_mask = attention_mask.view(batch_size, 1, 1, seq_len)
         elif attention_mask.dim() != 4:
             raise ValueError(f"Attention mask should be of shape (batch_size, 1, seq_len, seq_len) or (batch_size, 1, 1, seq_len), but got {attention_mask.shape}")
+        attention_mask = attention_mask.to(dtype=torch.bool)
         hidden_states = inputs_embeds