Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

1,294

Full-text search

Active filters: reinforcement-learning, transformers

AzalKhan/Qwen2.5-1.5B-Instruct_open-r1-DAPO-Math-17k-Processed_882

Reinforcement Learning • 2B • Updated 7 days ago • 186

AzalKhan/Qwen2.5-1.5B_open-r1-DAPO-Math-17k-Processed_294

Reinforcement Learning • 2B • Updated 7 days ago • 170

AzalKhan/Qwen2.5-1.5B_open-r1-DAPO-Math-17k-Processed_588

Reinforcement Learning • 2B • Updated 6 days ago • 169

AzalKhan/Qwen2.5-1.5B_open-r1-DAPO-Math-17k-Processed_882

Reinforcement Learning • 2B • Updated 6 days ago • 171