开源|AutoTTS:无需梯度更新,用编码Agent自动探索测试时扩展策略
thinkindev • 2026-05-12
1505 views
在AI大模型推理成本与日俱增的背景下,测试时扩展(Test-Time Scaling)正成为提升模型性能的前沿方向之一。近日,来自开源社区的项目AutoTTS提出了一种全新的自动化策略发现框架,旨在通过编码Agent在回放环境中迭代优化控制器逻辑,从而实现高效的测试时扩展,而无需进行任何梯度更新或调用在线大语言模型(LLM)。传统方法通常依赖手工设计的启发式规则或强大的在线模型来动态调整推理计算量,但AutoTTS另辟蹊径,将搜索过程视为一个代码编辑任务。其核心思想是让代码Agent在一个模拟的“回放环境”中不断试验、评估并修改控制器(Controller)行为,从而自动发现适用于不同任务和模型的最优扩展策略。这种方法不仅大幅降低了对昂贵API调用的依赖,还避免了复杂且不稳定的梯度计算,使得测试时扩展的自动寻优过程更加轻量、可复现且易于部署。这一工作对于推动AI推理效率、尤其是在资源受限环境下的应用,具有重要的实践价值和启发意义。
核心要点
- AutoTTS提出利用编码Agent在回放环境中自动发现测试时扩展策略,无需梯度更新。
- 该方法通过迭代优化控制器逻辑,替代了传统依赖手工规则或在线LLM调用的方式。
- 该框架旨在降低推理成本,提升测试时扩展在不同任务下的自动寻优能力与可部署性。