coco3143
/

Qwen2.5-0.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-0.5B-Open-R1-GRPO

Commit History

End of training

c4167a7
verified

coco3143 commited on Feb 12

Model save

b05aebb
verified

coco3143 commited on Feb 12

initial commit

9f9c002
verified

coco3143 commited on Feb 11