new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Oct 24

Submitted by

Mqleet

Human-Agent Collaborative Paper-to-Page Crafting for Under $0.1

Submitted by

yuezhouhu

AdaSPEC: Selective Knowledge Distillation for Efficient Speculative Decoders

GeorgiaTech

Georgia Institute of Technology

Submitted by

taesiri

Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

ByteDance

Submitted by

taesiri

HoloCine: Holistic Generation of Cinematic Multi-Shot Long Video Narratives

antgroup

Submitted by

jojo0217

Loopholing Discrete Diffusion: Deterministic Bypass of the Sampling Wall

·
5 authors

2

Submitted by

GuyYariv

DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion

The Hebrew University of Jerusalem

Submitted by

umarbutler

The Massive Legal Embedding Benchmark (MLEB)

isaacus

Submitted by

yudian

Every Question Has Its Own Value: Reinforcement Learning with Explicit Human Values

tencent

Submitted by

zenyn

SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-Language Models

nationaltaiwan

Submitted by

zenyn

Investigating Safety Vulnerabilities of Large Audio-Language Models Under Speaker Emotional Variations

nationaltaiwan

Submitted by

yujiazheng

Thought Communication in Multiagent Collaboration

·
7 authors

2

Submitted by

Necolizer

Search Self-play: Pushing the Frontier of Agent Capability without Supervision

Quark-LLM

Submitted by

RUBBISHLIKE

Conan: Progressive Learning to Reason Like a Detective over Multi-Scale Visual Evidence

PekingUniversity

Peking University

Submitted by

zcxu-eric

Seed3D 1.0: From Images to High-Fidelity Simulation-Ready 3D Assets

ByteDance-Seed

Submitted by

taesiri

LayerComposer: Interactive Personalized T2I via Spatially-Aware Layered Canvas

snap-research

Submitted by

jenyag

Diff-XYZ: A Benchmark for Evaluating Diff Understanding

JetBrains-Research

JetBrains Research

2

Submitted by

Xiaolong-Wang

ARGenSeg: Image Segmentation with Autoregressive Image Generation Model

inclusionAI

2

Submitted by

taesiri

AlphaFlow: Understanding and Improving MeanFlow Models

snap-research

Submitted by

taesiri

ImpossibleBench: Measuring LLMs' Propensity of Exploiting Test Cases

·
3 authors

Submitted by

BryanW

From Masks to Worlds: A Hitchhiker's Guide to World Models

·
10 authors

Submitted by

BUILDERlym

Communication to Completion: Modeling Collaborative Workflows with Intelligent Multi-Agent Communication

·
9 authors

Submitted by

ParagonLight

Adamas: Hadamard Sparse Attention for Efficient Long-Context Inference

·
7 authors

2

Submitted by

NaiveUser

Scaling Laws Meet Model Architecture: Toward Inference-Efficient LLMs

amazon

2

Submitted by

ParagonLight

Long-Context Attention Benchmark: From Kernel Efficiency to Distributed Context Parallelism

·
7 authors

2

Submitted by

eaglew

CiteGuard: Faithful Citation Attribution for LLMs via Retrieval-Augmented Validation

·
5 authors

Submitted by

Snooow1029

MSC-Bench: A Rigorous Benchmark for Multi-Server Tool Orchestration

nationaltaiwan

2

Submitted by

ravfogs

Emergence of Linear Truth Encodings in Language Models

·
5 authors

Submitted by

aritraroy24

ComProScanner: A multi-agent based framework for composition-property structured data extraction from scientific literature

slimeslab

South London Innovative Materials Evaluation Squad (SLIMES) Lab

2