umerghafoor
/

summarization-policy-model

Text Generation

text-generation-inference

Model card Files Files and versions Community

umerghafoor commited on Mar 30

Commit

41f3f05

·

verified ·

1 Parent(s): 3a77bc8

Upload GPTBigCodeForCausalLM

Files changed (3) hide show

README.md +3 -1
config.json +1 -3
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -1,6 +1,8 @@
 ---
 library_name: transformers
-tags: []
 ---
 # Model Card for Model ID

 ---
 library_name: transformers
+tags:
+- trl
+- reward-trainer
 ---
 # Model Card for Model ID

config.json CHANGED Viewed

@@ -7,7 +7,6 @@
   "attn_pdrop": 0.1,
   "bos_token_id": 0,
   "embd_pdrop": 0.1,
-  "end_token_id": 0,
   "eos_token_id": 0,
   "inference_runner": 0,
   "initializer_range": 0.02,
@@ -22,7 +21,6 @@
   "n_layer": 20,
   "n_positions": 8192,
   "pad_key_length": true,
-  "pad_token_id": 0,
   "pre_allocate_kv_cache": false,
   "resid_pdrop": 0.1,
   "scale_attention_softmax_in_fp32": true,
@@ -34,7 +32,7 @@
   "summary_use_proj": true,
   "torch_dtype": "float32",
   "transformers_version": "4.50.0",
-  "use_cache": false,
   "validate_runner_input": true,
   "vocab_size": 49152
 }

   "attn_pdrop": 0.1,
   "bos_token_id": 0,
   "embd_pdrop": 0.1,
   "eos_token_id": 0,
   "inference_runner": 0,
   "initializer_range": 0.02,
   "n_layer": 20,
   "n_positions": 8192,
   "pad_key_length": true,
   "pre_allocate_kv_cache": false,
   "resid_pdrop": 0.1,
   "scale_attention_softmax_in_fp32": true,
   "summary_use_proj": true,
   "torch_dtype": "float32",
   "transformers_version": "4.50.0",
+  "use_cache": true,
   "validate_runner_input": true,
   "vocab_size": 49152
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f11078341768fe97bd260cfdddb565d7a4d7dec5831e96953d5005e4f6bc0a4a
 size 656601304

 version https://git-lfs.github.com/spec/v1
+oid sha256:4534e232c3f20db1774695ec7a8c5ef0506799b0377996be5dbce2f3044c65ae
 size 656601304