Lize Pirenne

Inversta

Pangasius

AI & ML interests

LLMs, RL

Recent Activity

upvoted a paper 3 days ago

EuroBERT: Scaling Multilingual Encoders for European Languages

upvoted a paper 4 days ago

Token-Efficient Long Video Understanding for Multimodal LLMs

upvoted a paper 4 days ago

Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs

View all activity

Organizations

None yet

Inversta's activity

upvoted a paper 3 days ago

EuroBERT: Scaling Multilingual Encoders for European Languages

Paper • 2503.05500 • Published 6 days ago • 72

upvoted 2 papers 4 days ago

Token-Efficient Long Video Understanding for Multimodal LLMs

Paper • 2503.04130 • Published 8 days ago • 77

Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs

Paper • 2503.01743 • Published 10 days ago • 72

upvoted 2 papers 10 days ago

Chain of Draft: Thinking Faster by Writing Less

Paper • 2502.18600 • Published 16 days ago • 44

Predictive Data Selection: The Data That Predicts Is the Data That Teaches

Paper • 2503.00808 • Published 12 days ago • 53

liked a Space 10 days ago

2.24k

The Ultra-Scale Playbook

🌌

The ultimate guide to training LLM on large GPU Clusters

upvoted a paper 17 days ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 22 days ago • 179

upvoted 5 papers 18 days ago

SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models

Paper • 2502.09604 • Published 28 days ago • 33

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

Paper • 2502.08910 • Published 29 days ago • 143

upvoted 8 papers about 1 month ago

SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Paper • 2502.02737 • Published Feb 4 • 203

s1: Simple test-time scaling

Paper • 2501.19393 • Published Jan 31 • 111

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published Jan 28 • 108

Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate

Paper • 2501.17703 • Published Jan 29 • 55

Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26 • 63

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Paper • 2501.11425 • Published Jan 20 • 93

Kimi k1.5: Scaling Reinforcement Learning with LLMs

Paper • 2501.12599 • Published Jan 22 • 103

Humanity's Last Exam

Paper • 2501.14249 • Published Jan 24 • 66