Thinking Machines Lab发布交互模型：实时人机协作的可扩展新范式

Thinking Machines Lab 近日发布了一项名为“交互模型”的研究预览，旨在通过音频、视频和文本三种模态，实现人类与人工智能之间的实时协作。该模型采用从头训练的“多流架构”，能够持续处理与交换多模态信息，彻底打破了传统人工智能对话系统基于“轮次”的交互限制，实现了真正的实时响应。这种设计不仅显著提升了交互的流畅度和自然度，还具备高度的可扩展性。研究人员指出，该模型在智能助教、远程协作、实时翻译、游戏互动以及工业控制等多个领域拥有广阔的应用前景，代表了人机协作从“指令-响应”迈向“持续对话”的重要一步。这一突破有望重新定义未来人机交互的边界，推动更具自适应性和智能性的协作系统发展。