RLMs (Reasoning Language Models) - a sugatoray Collection

sugatoray 's Collections

RLMs (Reasoning Language Models)

Books And Notes

Reasoning Datasets

SmolAgents Tools (Spaces)

Bookmark::Models

LLMs

AV LLMs

LLM Training Datasets

Papers

Leaderboards 🔥

Papers-Fundamentals

TFM: TimeSeries Foundation Models

Papers-Benchmarks

LLMs-EmbeddingModels

LLM + Datasets : Finance

RLMs (Reasoning Language Models)

updated 2 days ago

LADDER: Self-Improving LLMs Through Recursive Problem Decomposition

Paper • 2503.00735 • Published 23 days ago • 19
START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published 18 days ago • 98
R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning

Paper • 2503.05592 • Published 17 days ago • 25
R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcing Learning

Paper • 2503.05379 • Published 17 days ago • 33
RekaAI/reka-flash-3

Updated 11 days ago • 4.68k • 333
RekaAI/VibeEval

Viewer • Updated Dec 12, 2024 • 269 • 4.08k • 45
Qwen/QwQ-32B

Text Generation • Updated 13 days ago • 588k • • 2.49k
open-r1/OlympicCoder-7B

Text Generation • Updated 7 days ago • 4.77k • 146
open-r1/OlympicCoder-32B

Text Generation • Updated 7 days ago • 2.7k • 131
Reinforcement Learning for Reasoning in Small LLMs: What Works and What Doesn't

Paper • 2503.16219 • Published 4 days ago • 38