Kai Zuberbühler

kaizuberbuehler

k-zubi

AI & ML interests

language models, agents, image generation, music generation

Recent Activity

updated a collection 1 day ago

Reasoning, Thinking, RL and Test-Time Scaling

upvoted a paper 1 day ago

Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning

updated a collection 4 days ago

LM Training

View all activity

Organizations

None yet

kaizuberbuehler's activity

upvoted a paper 1 day ago

Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning

Paper • 2503.09516 • Published 3 days ago • 15

upvoted 8 papers 4 days ago

Continuous Diffusion Model for Language Modeling

Paper • 2502.11564 • Published 26 days ago • 52

Magma: A Foundation Model for Multimodal AI Agents

Paper • 2502.13130 • Published 25 days ago • 56

Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity

Paper • 2502.13063 • Published 25 days ago • 67

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published 27 days ago • 143

Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published 24 days ago • 164

upvoted 2 papers 6 days ago

Learning Getting-Up Policies for Real-World Humanoid Robots

Paper • 2502.12152 • Published 26 days ago • 37

Diverse Inference and Verification for Advanced Reasoning

Paper • 2502.09955 • Published 29 days ago • 17

upvoted an article 19 days ago

Article

Agent Leaderboard: Evaluating AI Agents in Multi-Domain Scenarios

and 1 other •

Feb 12

• 16

upvoted 8 papers 21 days ago

PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

Paper • 2502.14282 • Published 24 days ago • 20

S*: Test Time Scaling for Code Generation

Paper • 2502.14382 • Published 23 days ago • 60

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 23 days ago • 179

Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published 26 days ago • 28

MMTEB: Massive Multilingual Text Embedding Benchmark

Paper • 2502.13595 • Published 24 days ago • 32

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

Paper • 2502.09696 • Published 30 days ago • 39

The Danger of Overthinking: Examining the Reasoning-Action Dilemma in Agentic Tasks

Paper • 2502.08235 • Published Feb 12 • 55

Large Language Diffusion Models

Paper • 2502.09992 • Published 29 days ago • 103