Benchmark Test-Time Scaling of General LLM Agents

This research investigates critical scaling limitations in general-purpose LLM agents, revealing how sequential and parallel regimes face distinct architectu...

Level: advanced

By Xiaochuan Li, Ryan Ming, Pranav Setlur, Abhijay Paladugu, Andy Tang, Hao Kang, Shuai Shao, Rong Jin, Chenyan Xiong

Category: research