inclusionAI
/

Ling-lite-base

Text Generation

Model card Files Files and versions Community

zhujiangang commited on Mar 20

Commit

c9c10d7

·

verified ·

1 Parent(s): 6a4f845

Update configuration_bailing_moe.py

Files changed (1) hide show

configuration_bailing_moe.py +2 -2

configuration_bailing_moe.py CHANGED Viewed

@@ -63,7 +63,7 @@ class BailingMoeConfig(PretrainedConfig):
         self.use_sliding_window = use_sliding_window
         self.sliding_window = sliding_window
         self.max_window_layers = max_window_layers
-        self.head_dim = head_dim
         self.rope_scaling = rope_scaling
         # MoE configs
@@ -75,4 +75,4 @@ class BailingMoeConfig(PretrainedConfig):
         self.first_k_dense_replace = first_k_dense_replace
         self.output_router_logits = output_router_logits
-        super().__init__(pad_token_id=pad_token_id, tie_word_embeddings=tie_word_embeddings, **kwargs)

         self.use_sliding_window = use_sliding_window
         self.sliding_window = sliding_window
         self.max_window_layers = max_window_layers
+        self.head_dim = head_dim or self.hidden_size // self.num_attention_heads
         self.rope_scaling = rope_scaling
         # MoE configs
         self.first_k_dense_replace = first_k_dense_replace
         self.output_router_logits = output_router_logits
+        super().__init__(pad_token_id=pad_token_id, tie_word_embeddings=tie_word_embeddings, **kwargs)