Haoyu Wang's picture

2 10 3

Haoyu Wang

Harryis

·

AI & ML interests

None yet

Recent Activity

updated a dataset about 2 months ago

Harryis/strategy

upvoted a paper about 2 months ago

Diffusion Language Models are Super Data Learners

published a dataset about 2 months ago

Harryis/strategy

View all activity

Organizations

None yet

upvoted a paper about 2 months ago

Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5 • 128

upvoted 5 papers 3 months ago

A-MemGuard: A Proactive Defense Framework for LLM-Based Agent Memory

Paper • 2510.02373 • Published Sep 29 • 10

GEM: A Gym for Agentic LLMs

Paper • 2510.01051 • Published Oct 1 • 89

UltraHorizon: Benchmarking Agent Capabilities in Ultra Long-Horizon Scenarios

Paper • 2509.21766 • Published Sep 26 • 23

Language Models Can Learn from Verbal Feedback Without Scalar Rewards

Paper • 2509.22638 • Published Sep 26 • 70

Variational Reasoning for Language Models

Paper • 2509.22637 • Published Sep 26 • 69

upvoted a paper 4 months ago

SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning

Paper • 2509.02479 • Published Sep 2 • 83

upvoted a paper 7 months ago

Lifelong Safety Alignment for Language Models

Paper • 2505.20259 • Published May 26 • 23

upvoted a paper 11 months ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 431

upvoted a paper almost 2 years ago

Step-On-Feet Tuning: Scaling Self-Alignment of LLMs via Bootstrapping

Paper • 2402.07610 • Published Feb 12, 2024 • 9