Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

README.md +11 -18
config.json +1 -1
mergekit_config.yml +7 -8
model-00001-of-00004.safetensors +1 -1
model-00002-of-00004.safetensors +1 -1
model-00003-of-00004.safetensors +1 -1
model-00004-of-00004.safetensors +1 -1

README.md CHANGED Viewed

@@ -1,10 +1,7 @@
 ---
 base_model:
-- marcuscedricridia/Hush-Qwen2.5-7B-della4
-- marcuscedricridia/Hush-Qwen2.5-7B-della3
-- marcuscedricridia/Hush-Qwen2.5-7B-della2
-- marcuscedricridia/Hush-Qwen2.5-7B-della1
-- marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4-1M
 library_name: transformers
 tags:
 - mergekit
@@ -18,32 +15,28 @@ This is a merge of pre-trained language models created using [mergekit](https://
 ## Merge Details
 ### Merge Method
-This model was merged using the [Model Stock](https://arxiv.org/abs/2403.19522) merge method using [marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4-1M](https://huggingface.co/marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4-1M) as a base.
 ### Models Merged
 The following models were included in the merge:
-* [marcuscedricridia/Hush-Qwen2.5-7B-della4](https://huggingface.co/marcuscedricridia/Hush-Qwen2.5-7B-della4)
-* [marcuscedricridia/Hush-Qwen2.5-7B-della3](https://huggingface.co/marcuscedricridia/Hush-Qwen2.5-7B-della3)
-* [marcuscedricridia/Hush-Qwen2.5-7B-della2](https://huggingface.co/marcuscedricridia/Hush-Qwen2.5-7B-della2)
-* [marcuscedricridia/Hush-Qwen2.5-7B-della1](https://huggingface.co/marcuscedricridia/Hush-Qwen2.5-7B-della1)
 ### Configuration
 The following YAML configuration was used to produce this model:
 ```yaml
-merge_method: model_stock
-base_model: marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4-1M
 models:
-  - model: marcuscedricridia/Hush-Qwen2.5-7B-della1
-  - model: marcuscedricridia/Hush-Qwen2.5-7B-della2
-  - model: marcuscedricridia/Hush-Qwen2.5-7B-della3
-  - model: marcuscedricridia/Hush-Qwen2.5-7B-della4
 dtype: bfloat16
 tokenizer_source: base
-int8_mask: true
 normalize: true
-name: Hush-Qwen2.5-7B-v1.4
 ```

 ---
 base_model:
+- Qwen/Qwen2.5-7B-Instruct-1M
+- marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4
 library_name: transformers
 tags:
 - mergekit
 ## Merge Details
 ### Merge Method
+This model was merged using the [SCE](https://arxiv.org/abs/2408.07990) merge method using [Qwen/Qwen2.5-7B-Instruct-1M](https://huggingface.co/Qwen/Qwen2.5-7B-Instruct-1M) as a base.
 ### Models Merged
 The following models were included in the merge:
+* [marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4](https://huggingface.co/marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4)
 ### Configuration
 The following YAML configuration was used to produce this model:
 ```yaml
+merge_method: sce
 models:
+  - model: marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4
+base_model: Qwen/Qwen2.5-7B-Instruct-1M
+parameters:
+  select_topk: 1
 dtype: bfloat16
 tokenizer_source: base
 normalize: true
+int8_mask: true
+name: Hush-Qwen2.5-7B-RP-v1.4-1M
 ```

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4-1M",
   "architectures": [
     "Qwen2ForCausalLM"
   ],

 {
+  "_name_or_path": "Qwen/Qwen2.5-7B-Instruct-1M",
   "architectures": [
     "Qwen2ForCausalLM"
   ],

mergekit_config.yml CHANGED Viewed

@@ -1,12 +1,11 @@
-merge_method: model_stock
-base_model: marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4-1M
 models:
-  - model: marcuscedricridia/Hush-Qwen2.5-7B-della1
-  - model: marcuscedricridia/Hush-Qwen2.5-7B-della2
-  - model: marcuscedricridia/Hush-Qwen2.5-7B-della3
-  - model: marcuscedricridia/Hush-Qwen2.5-7B-della4
 dtype: bfloat16
 tokenizer_source: base
-int8_mask: true
 normalize: true
-name: Hush-Qwen2.5-7B-v1.4

+merge_method: sce
 models:
+  - model: marcuscedricridia/Hush-Qwen2.5-7B-RP-v1.4
+base_model: Qwen/Qwen2.5-7B-Instruct-1M
+parameters:
+  select_topk: 1
 dtype: bfloat16
 tokenizer_source: base
 normalize: true
+int8_mask: true
+name: Hush-Qwen2.5-7B-RP-v1.4-1M

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e0e265d51702279301544912f9e2e88614faa93dac57adb48f4facb88d8512b1
 size 4970978712

 version https://git-lfs.github.com/spec/v1
+oid sha256:e6ab227a818d16ed0d99568eb39128f6bc5eff3a52b91d8970298aabcaea2fe0
 size 4970978712

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2af3f58da59eca08804c7cd8bb7072f964642b9809f6e9a5e093ed9051595168
 size 4932751032

 version https://git-lfs.github.com/spec/v1
+oid sha256:1cad3f2fefdb8ac91adb28b6c8fb3d3f9ac5574b3a1cb73ec2fd1877e962f4aa
 size 4932751032

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a635b04ad03e8f0e754233d14675656bda3140e298e4dd1662c610166699cd0a
 size 4991495808

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f63487eaba343672a7fe1e339025106d9201988d24ac5ee364a40c2feca75b8
 size 4991495808

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8efd5a03b34100f0d96e1fcc82eb552e786942baf5bddf0648422faa819a147b
 size 330326240

 version https://git-lfs.github.com/spec/v1
+oid sha256:511c1588760348f57f0877b013cf62822a45c2d2c8e158cb6adaafe63bc40f78
 size 330326240