Crystalcareai
/

Quiet-Star-Custom

Text Generation

Model card Files Files and versions

Crystalcareai commited on Apr 6, 2024

Commit

1a7d227

·

verified ·

1 Parent(s): 9b89e6b

Update modeling_quiet.py

Files changed (1) hide show

modeling_quiet.py +2 -3

modeling_quiet.py CHANGED Viewed

@@ -1430,7 +1430,7 @@ class QuietForCausalLM(QuietPreTrainedModel, GenerationMixin):
 		input_ids: torch.LongTensor,
 		attention_mask: Optional[torch.Tensor] = None,
 		max_new_tokens: Optional[int] = None,
-		temperature: float = 0.9,
 		**kwargs,
 	):
 		if attention_mask is None:
@@ -1438,8 +1438,7 @@ class QuietForCausalLM(QuietPreTrainedModel, GenerationMixin):
 			attention_mask = torch.ones_like(input_ids)
 		from .generate import generate
-		generated_token_ids, attention_mask = generate(self, input_ids=input_ids, attention_mask=attention_mask, max_new_tokens=max_new_tokens, temperature=temperature, **kwargs)
-		return generated_token_ids, attention_mask
 	@add_start_docstrings_to_model_forward(QUIET_INPUTS_DOCSTRING)
 	@replace_return_docstrings(output_type=CausalLMOutputWithPast, config_class=_CONFIG_FOR_DOC)

 		input_ids: torch.LongTensor,
 		attention_mask: Optional[torch.Tensor] = None,
 		max_new_tokens: Optional[int] = None,
+		temperature: float = 1.1,
 		**kwargs,
 	):
 		if attention_mask is None:
 			attention_mask = torch.ones_like(input_ids)
 		from .generate import generate
+		return generate(self, input_ids=input_ids, attention_mask=attention_mask, max_new_tokens=max_new_tokens, temperature=temperature, **kwargs)
 	@add_start_docstrings_to_model_forward(QUIET_INPUTS_DOCSTRING)
 	@replace_return_docstrings(output_type=CausalLMOutputWithPast, config_class=_CONFIG_FOR_DOC)