samitizerxu
/

Qwen2.5-R1-Distill-GRPO-h

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-R1-Distill-GRPO-h

Commit History

End of training

bf55c03
verified

samitizerxu commited on 13 days ago

Model save

4c7f5a8
verified

samitizerxu commited on 13 days ago

Training in progress, epoch 0

185a550
verified

samitizerxu commited on 13 days ago

initial commit

6418601
verified

samitizerxu commited on 13 days ago