Spaces:

Dovakiins
/

qwerrwe

Build error

bump transformers and update attention class map name (#1023)

bcc78d8 unverified almost 2 years ago

658 Bytes

	"""
	Patches to support multipack for mixtral
	"""
	import transformers


	def replace_mixtral_attn_with_multipack_flash_attn():
	from .modeling_mixtral import (
	MixtralMultipackFlashAttention2,
	mixtral_decoder_layer_forward,
	mixtral_model_forward,
	)

	transformers.models.mixtral.modeling_mixtral.MixtralDecoderLayer.forward = (
	mixtral_decoder_layer_forward
	)
	transformers.models.mixtral.modeling_mixtral.MixtralModel.forward = (
	mixtral_model_forward
	)
	transformers.models.mixtral.modeling_mixtral.MIXTRAL_ATTENTION_CLASSES[
	"flash_attention_2"
	] = MixtralMultipackFlashAttention2