open-r1
/

OpenR1-Qwen-7B

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

eliebak HF Staff commited on Feb 6

Commit

dd154b9

·

verified ·

1 Parent(s): 88c085f

End of training

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -1,4 +1,5 @@
 ---
 library_name: transformers
 model_name: R2-Q7B-GR1-ALL-s1k-5e-5-weight-decay-1e-4
 tags:
@@ -10,7 +11,7 @@ licence: license
 # Model Card for R2-Q7B-GR1-ALL-s1k-5e-5-weight-decay-1e-4
-This model is a fine-tuned version of [None](https://huggingface.co/None).
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start

 ---
+datasets: open-r1/numina-ALL-V4-verify-s1k
 library_name: transformers
 model_name: R2-Q7B-GR1-ALL-s1k-5e-5-weight-decay-1e-4
 tags:
 # Model Card for R2-Q7B-GR1-ALL-s1k-5e-5-weight-decay-1e-4
+This model is a fine-tuned version of [None](https://huggingface.co/None) on the [open-r1/numina-ALL-V4-verify-s1k](https://huggingface.co/datasets/open-r1/numina-ALL-V4-verify-s1k) dataset.
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start