Dongwei
/

Qwen2.5-1.5B-Open-R1-GRPO_Math_smalllr

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO_Math_smalllr

Commit History

End of training

578adc4
verified

Dongwei commited on 18 days ago

Model save

035ae8a
verified

Dongwei commited on 18 days ago

initial commit

d0804f4
verified

Dongwei commited on 18 days ago