yujiepan
/

jamba-1.5-tiny-random

Text Generation

Model card Files Files and versions

yujiepan commited on Aug 24, 2024

Commit

decbd59

·

verified ·

1 Parent(s): 73a5767

Upload folder using huggingface_hub

Files changed (2) hide show

README.md +1 -1
config.json +1 -1

README.md CHANGED Viewed

@@ -30,7 +30,7 @@ config.intermediate_size = 16
 config.num_attention_heads = 4
 config.num_hidden_layers = 16
 config.num_key_value_heads = 2
-config.use_mamba_kernels = False
 model = AutoModelForCausalLM.from_config(
     config, torch_dtype=torch.bfloat16, attn_implementation="sdpa", trust_remote_code=True

 config.num_attention_heads = 4
 config.num_hidden_layers = 16
 config.num_key_value_heads = 2
+# config.use_mamba_kernels = False
 model = AutoModelForCausalLM.from_config(
     config, torch_dtype=torch.bfloat16, attn_implementation="sdpa", trust_remote_code=True

config.json CHANGED Viewed

@@ -40,6 +40,6 @@
   "torch_dtype": "bfloat16",
   "transformers_version": "4.44.0",
   "use_cache": true,
-  "use_mamba_kernels": false,
   "vocab_size": 65536
 }

   "torch_dtype": "bfloat16",
   "transformers_version": "4.44.0",
   "use_cache": true,
+  "use_mamba_kernels": true,
   "vocab_size": 65536
 }