15 566 240

Taufiq Dwi Purnomo

taufiqdp

https://taufiqdp.com

AI & ML interests

SLM, VLM

Recent Activity

upvoted a paper about 4 hours ago

mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data

upvoted a paper about 4 hours ago

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

updated a model 1 day ago

taufiqdp/convnext-arutala-v2

View all activity

Organizations

taufiqdp's activity

upvoted 2 papers about 4 hours ago

mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data

Paper • 2502.08468 • Published 2 days ago • 5

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

Paper • 2502.08910 • Published 1 day ago • 50

updated a model 1 day ago

taufiqdp/convnext-arutala-v2

Image Classification • Updated 8 days ago • 80

upvoted a paper 1 day ago

TransMLA: Multi-head Latent Attention Is All You Need

Paper • 2502.07864 • Published 3 days ago • 32

liked a model 2 days ago

agentica-org/DeepScaleR-1.5B-Preview

Updated 3 days ago • 6.65k • 298

upvoted 2 papers 2 days ago

Scaling Pre-training to One Hundred Billion Data for Vision Language Models

Paper • 2502.07617 • Published 3 days ago • 23

Competitive Programming with Large Reasoning Models

Paper • 2502.06807 • Published 11 days ago • 53

upvoted 2 papers 3 days ago

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

Paper • 2502.06703 • Published 4 days ago • 116

Matryoshka Quantization

Paper • 2502.06786 • Published 4 days ago • 22

upvoted a paper 7 days ago

Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2

Paper • 2502.03544 • Published 9 days ago • 39

upvoted a paper 8 days ago

SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Paper • 2502.02737 • Published 10 days ago • 161

published a model 8 days ago

taufiqdp/convnext-arutala-v2

Image Classification • Updated 8 days ago • 80

upvoted an article 10 days ago

Article

Open-source DeepResearch – Freeing our search agents

11 days ago

• 964

upvoted a paper 10 days ago

OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

Paper • 2502.01061 • Published 11 days ago • 171

updated a model 10 days ago

taufiqdp/convnext_tiny-arutala

Image Classification • Updated 10 days ago • 134

upvoted a paper 11 days ago

s1: Simple test-time scaling

Paper • 2501.19393 • Published 14 days ago • 100

upvoted an article 12 days ago

Article

Open-R1: Update #1

and 7 others •

13 days ago

• 276

upvoted a paper 14 days ago

Streaming DiLoCo with overlapping communication: Towards a Distributed Free Lunch

Paper • 2501.18512 • Published 15 days ago • 25

liked a model 14 days ago

mistralai/Mistral-Small-24B-Base-2501

Text Generation • Updated 15 days ago • 14.3k • 214

published a model 16 days ago

taufiqdp/convnext_tiny-arutala

Image Classification • Updated 10 days ago • 134