qgallouedec
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2.5-1.5B-Open-R1-GRPO / model.safetensors

Commit History

Model save

8a11b45
verified

qgallouedec HF staff commited on 8 days ago

Model save

7229b2f
verified

qgallouedec HF staff commited on 9 days ago

Model save

74880be
verified

qgallouedec HF staff commited on 9 days ago