coolcui
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Commit History

End of training

bcd9dc8
verified

coolcui commited on 13 days ago

Model save

fe2cc2c
verified

coolcui commited on 13 days ago

Training in progress, epoch 0

aa21fb2
verified

coolcui commited on 13 days ago

End of training

e8feb86
verified

coolcui commited on 16 days ago

Model save

55873ef
verified

coolcui commited on 16 days ago

Training in progress, epoch 0

b06e789
verified

coolcui commited on 16 days ago

End of training

716272e
verified

coolcui commited on 22 days ago

Model save

f8c79e5
verified

coolcui commited on 22 days ago

Training in progress, epoch 0

d773cfa
verified

coolcui commited on 22 days ago

initial commit

4debf27
verified

coolcui commited on 26 days ago