AdamLucek
/

Qwen2.5-3B-Instruct-GRPO-2K-GSM8K

Text Generation

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-GRPO-2K-GSM8K / generation_config.json

Commit History

Trained with Unsloth

f9ab313
verified

AdamLucek commited on Feb 14