HF Daily - a PeterLee6094 Collection

PeterLee6094 's Collections

HF Daily

updated about 16 hours ago

Large Language Diffusion Models

Paper • 2502.09992 • Published 11 days ago • 76
MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

Paper • 2502.10391 • Published 10 days ago • 30
Diverse Inference and Verification for Advanced Reasoning

Paper • 2502.09955 • Published 11 days ago • 16
Selective Self-to-Supervised Fine-Tuning for Generalization in Large Language Models

Paper • 2502.08130 • Published 13 days ago • 9
Jailbreaking to Jailbreak

Paper • 2502.09638 • Published 15 days ago • 3
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published 8 days ago • 134
ReLearn: Unlearning via Learning for Large Language Models

Paper • 2502.11190 • Published 8 days ago • 28
How Do LLMs Acquire New Knowledge? A Knowledge Circuits Perspective on Continual Pre-Training

Paper • 2502.11196 • Published 8 days ago • 20
CRANE: Reasoning with constrained LLM generation

Paper • 2502.09061 • Published 12 days ago • 18
One Example Shown, Many Concepts Known! Counterexample-Driven Conceptual Reasoning in Mathematical LLMs

Paper • 2502.10454 • Published 13 days ago • 7
Dyve: Thinking Fast and Slow for Dynamic Process Verification

Paper • 2502.11157 • Published 8 days ago • 6
Show Me the Work: Fact-Checkers' Requirements for Explainable Automated Fact-Checking

Paper • 2502.09083 • Published 12 days ago • 4
Continuous Diffusion Model for Language Modeling

Paper • 2502.11564 • Published 8 days ago • 49
Rethinking Diverse Human Preference Learning through Principal Component Analysis

Paper • 2502.13131 • Published 6 days ago • 34
SafeRoute: Adaptive Model Selection for Efficient and Accurate Safety Guardrails in Large Language Models

Paper • 2502.12464 • Published 7 days ago • 27
Revisiting the Test-Time Scaling of o1-like Models: Do they Truly Possess Test-Time Scaling Capabilities?

Paper • 2502.12215 • Published 8 days ago • 15
HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading

Paper • 2502.12574 • Published 7 days ago • 9
The Hidden Risks of Large Reasoning Models: A Safety Assessment of R1

Paper • 2502.12659 • Published 7 days ago • 5
Injecting Domain-Specific Knowledge into Large Language Models: A Comprehensive Survey

Paper • 2502.10708 • Published 10 days ago • 4
Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published 5 days ago • 139
On the Trustworthiness of Generative Foundation Models: Guideline, Assessment, and Perspective

Paper • 2502.14296 • Published 5 days ago • 42
Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published 7 days ago • 26
LongPO: Long Context Self-Evolution of Large Language Models through Short-to-Long Preference Optimization

Paper • 2502.13922 • Published 5 days ago • 25
MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 4 days ago • 156
From RAG to Memory: Non-Parametric Continual Learning for Large Language Models

Paper • 2502.14802 • Published 4 days ago • 9