studyinglover
/

IntelliKernel-0.03b-pretrained

Text Generation

Model card Files Files and versions

IntelliKernel-0.03b-pretrained / config.py

studyinglover's picture

Upload Transformer

13ac840 verified 10 months ago

history blame contribute delete

914 Bytes

	from transformers import PretrainedConfig


	class ModelConfig(PretrainedConfig):
	model_type = "IntelliKernel"

	def __init__(
	self,
	dim: int = 512,
	n_layers: int = 8,
	n_heads: int = 16,
	n_kv_heads: int = 8,
	vocab_size: int = 6400,
	hidden_dim: int = None,
	multiple_of: int = 64,
	norm_eps: float = 1e-5,
	max_seq_len: int = 512,
	dropout: float = 0.0,
	flash_attn: bool = True,
	**kwargs,
	):
	self.dim = dim
	self.n_layers = n_layers
	self.n_heads = n_heads
	self.n_kv_heads = n_kv_heads
	self.vocab_size = vocab_size
	self.hidden_dim = hidden_dim
	self.multiple_of = multiple_of
	self.norm_eps = norm_eps
	self.max_seq_len = max_seq_len
	self.dropout = dropout
	self.flash_attn = flash_attn

	super().__init__(**kwargs)