weltonwang88
/

Qwen2.5-1.5B-Open-R1-GRPO-cot

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO-cot

Commit History

End of training

941d5ca
verified

weltonwang88 commited on 5 days ago

Model save

07522fb
verified

weltonwang88 commited on 5 days ago

Training in progress, step 12

fa66a4d
verified

weltonwang88 commited on 5 days ago

initial commit

9ac27fb
verified

weltonwang88 commited on 5 days ago