new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Feb 13

Submitted by

xunyoyo

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

·
13 authors

7

Submitted by

xx18

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

Tencent-Hunyuan

Tencent Hunyuan

Submitted by

myownskyW7

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

sii-research

Shanghai Innovation Institute

Submitted by

Keven16

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

Tencent-Hunyuan

Tencent Hunyuan

Submitted by

fdugyt

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

OpenMOSS-Team

Submitted by

zhaocheng

NarraScore: Bridging Visual Narrative and Musical Dynamics via Hierarchical Affective Control

ByteDance

2

Submitted by

Jeff-Wang

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

open-gigaai

Submitted by

SnowNation

LawThinker: A Deep Research Legal Agent in Dynamic Environments

RUC

Renmin University of China

Submitted by

chengtan9907

Thinking with Drafting: Optical Decompression via Logical Reconstruction

ByteDance

3

Submitted by

jayinnn

Stroke of Surprise: Progressive Semantic Illusions in Vector Sketching

NYCU

National Yang Ming Chiao Tung University

Submitted by

ramiroluo

Think Longer to Explore Deeper: Learn to Explore In-Context via Length-Incentivized Reinforcement Learning

Westlake-University

Westlake University

Submitted by

JiazhiYang

RISE: Self-Improving Robot Policy with Compositional World Model

OpenDriveLab

Submitted by

Chonghao

χ_{0}: Resource-Aware Robust Manipulation via Taming Distributional Inconsistencies

hkuhk

The University of Hong Kong

Submitted by

FSCCS

dVoting: Fast Voting for dLLMs

NationalUniversityofSingapore

National University of Singapore

Submitted by

ModiShi

EgoHumanoid: Unlocking In-the-Wild Loco-Manipulation with Robot-Free Egocentric Demonstration

·
9 authors

Submitted by

adwardlee

DeepSight: An All-in-One LM Safety Toolkit

Submitted by

ilnehc

Sparse Video Generation Propels Real-World Beyond-the-View Vision-Language Navigation

·
8 authors

Submitted by

MatteoNulli

Adapting Vision-Language Models for E-commerce Understanding at Scale

eBay

eBay

Submitted by

Liangqiong-QU

Unveiling Implicit Advantage Symmetry: Why GRPO Struggles with Exploration and Difficulty Adaptation

hkuhk

The University of Hong Kong

Submitted by

vztu

PISCO: Precise Video Instance Insertion with Sparse Control

TexasAMUniversity

Texas A&M University

Submitted by

Tyrion279

T3D: Few-Step Diffusion Language Models via Trajectory Self-Distillation with Direct Discriminative Optimization

·
12 authors

Submitted by

XinXuNLPer

ThinkRouter: Efficient Reasoning via Routing Thinking between Latent and Discrete Spaces

·
6 authors

2

Submitted by

taesiri

Voxtral Realtime

mistralai

Submitted by

kmitsides

Dreaming in Code for Curriculum Learning in Open-Ended Worlds

ImperialCollegeLondon

Imperial College London

Submitted by

taesiri

MiniCPM-SALA: Hybridizing Sparse and Linear Attention for Efficient Long-Context Modeling

openbmb

Submitted by

visity

MemFly: On-the-Fly Memory Optimization via Information Bottleneck

·
7 authors

Submitted by

lewtun

Single-minus gluon tree amplitudes are nonzero

openai

Submitted by

taesiri

Gaia2: Benchmarking LLM Agents on Dynamic and Asynchronous Environments

metaresearch

Submitted by

taesiri

MolmoSpaces: A Large-Scale Open Ecosystem for Robot Navigation and Manipulation

ai21labs

AI21

Submitted by

MING-ZCH

MetaphorStar: Image Metaphor Understanding and Reasoning with End-to-End Visual Reinforcement Learning

·
3 authors

Submitted by

mathieu-sibue

ExStrucTiny: A Benchmark for Schema-Variable Structured Information Extraction from Document Images

jpmorganchase

JP Morgan Chase

Submitted by

tnlin

P-GenRM: Personalized Generative Reward Model with Test-time User-based Scaling

Tongyi-ConvAI

Submitted by

leolhb

Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use

RUC

Renmin University of China

2

Submitted by

HanNight

Multimodal Fact-Level Attribution for Verifiable Reasoning

·
6 authors

Submitted by

sY713

Sci-CoE: Co-evolving Scientific Reasoning LLMs via Geometric Consensus with Sparse Supervision

InternScience

Submitted by

MaplesWCT

ScalSelect: Scalable Training-Free Multimodal Data Selection for Efficient Visual Instruction Tuning

ZGCA

Zhongguancun Academy

Submitted by

taesiri

ABot-N0: Technical Report on the VLA Foundation Model for Versatile Embodied Navigation

·
44 authors

Submitted by

zjr2000

Pretraining A Large Language Model using Distributed GPUs: A Memory-Efficient Decentralized Paradigm

PolyUHK

The Hong Kong Polytechnic University

Submitted by

TeddyXGZ

Neural Additive Experts: Context-Gated Experts for Controllable Model Additivity

·
3 authors

Submitted by

slseanwu

Stemphonic: All-at-once Flexible Multi-stem Music Generation

MIT

Massachusetts Institute of Technology

Submitted by

StevenZHB

Detecting RLVR Training Data via Structural Convergence of Reasoning

WestlakeNLP

Text Intelligence Lab of Westlake University