glorgao
/

Qwen-2.5-Math-7B-GRPO-KL0003

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen-2.5-Math-7B-GRPO-KL0003

Commit History

End of training

ccfb52c
verified

glorgao commited on 26 days ago

Model save

53cde97
verified

glorgao commited on 26 days ago

initial commit

ef4bbc1
verified

glorgao commited on 27 days ago