WideSeek-R1 - a RLinf Collection

RLinf 's Collections

WideSeek-R1

updated 15 days ago

WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning

RLinf/WideSeek-R1-4b

Text Generation • 4B • Updated 15 days ago • 57 • 2
RLinf/WideSeek-R1-train-data

Preview • Updated 15 days ago • 103 • 1
WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning

Paper • 2602.04634 • Published Feb 4 • 98
RLinf/Wiki-2018-Corpus

Updated 15 days ago • 2.68k
RLinf/WideSeek-R1-test-data

Viewer • Updated 15 days ago • 200 • 18