Thinking Machines Lab发布交互模型:实时人机协作的可扩展新范式
thinkindev • 2026-05-12
1372 views
Thinking Machines Lab 近日发布了一项名为“交互模型”的研究预览,旨在通过音频、视频和文本三种模态,实现人类与人工智能之间的实时协作。该模型采用从头训练的“多流架构”,能够持续处理与交换多模态信息,彻底打破了传统人工智能对话系统基于“轮次”的交互限制,实现了真正的实时响应。这种设计不仅显著提升了交互的流畅度和自然度,还具备高度的可扩展性。研究人员指出,该模型在智能助教、远程协作、实时翻译、游戏互动以及工业控制等多个领域拥有广阔的应用前景,代表了人机协作从“指令-响应”迈向“持续对话”的重要一步。这一突破有望重新定义未来人机交互的边界,推动更具自适应性和智能性的协作系统发展。
核心要点
- Thinking Machines Lab 推出全新的交互模型,支持音频、视频和文本的实时人机协作。
- 模型采用多流架构从头训练,消除了传统的轮次限制,实现了真正的实时连续交互。
- 该可扩展方法在多个领域具有实际应用潜力,旨在提升交互性与智能水平。