Augmenting Pretrained FMs with Post-Training/RL - a abhranil14 Collection

abhranil14 's Collections

Augmenting Pretrained FMs with Post-Training/RL

RL/FM/Agent Data/Benchmark

FM4 EmbodiedAI/Robotics/DecisionMaking

FM_Training_Infra

Foundation Models Empirical Analysis

Survey LLM/VLM/MLM

RL

Reasoning/System2

Augmenting Pretrained FMs with Post-Training/RL

updated 2 days ago

AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO

Paper • 2502.14669 • Published 21 days ago • 11
R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning

Paper • 2503.05592 • Published 6 days ago • 24