Crystalcareai
/

Quiet-Star-Custom

Text Generation

Model card Files Files and versions Community

Crystalcareai commited on Mar 26, 2024

Commit

b2672e5

·

verified ·

1 Parent(s): b28a110

Update modeling_quiet.py

Files changed (1) hide show

modeling_quiet.py +9 -11

modeling_quiet.py CHANGED Viewed

@@ -1682,18 +1682,16 @@ class QuietForCausalLM(QuietPreTrainedModel):
                     assert self.no_residual
                     residual_logits = self.lm_head(hidden_states)
                     talk_hidden_states = hidden_states
                 else:
-                    if 'hidden_states_lm' not in locals():
-                        hidden_states_lm = hidden_states
-                    rm_hidden_states = hidden_states
-                else:
-                    if ahead_idx > self.n_ahead - 1:
-                        cur_base_hidden = torch.cat([
-                            base_hidden_states[..., ahead_idx - self.n_ahead + 1:, :],
-                            base_hidden_states[..., :ahead_idx - self.n_ahead + 1, :]
-                        ], dim=-2)
-                    else:
-                        cur_base_hidden = base_hidden_states
                     if self.use_concat_talk_head:
                         # concatenate the hidden states with the original hidden states

                     assert self.no_residual
                     residual_logits = self.lm_head(hidden_states)
                     talk_hidden_states = hidden_states
+                if 'hidden_states_lm' not in locals():
+                    hidden_states_lm = hidden_states
+                rm_hidden_states = hidden_states
+                if ahead_idx > self.n_ahead - 1:
+                    cur_base_hidden = torch.cat([
+                        base_hidden_states[..., ahead_idx - self.n_ahead + 1:, :],
+                        base_hidden_states[..., :ahead_idx - self.n_ahead + 1, :]
+                    ], dim=-2)
                 else:
+                    cur_base_hidden = base_hidden_states
                     if self.use_concat_talk_head:
                         # concatenate the hidden states with the original hidden states