漫话开发者 - UWL.ME Mobile
Loading more...
漫话开发者 - UWL.ME Mobile

英伟达今日正式发布Cosmos 3,这是一款面向物理AI的开源世界基础模型,标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器(Mixture-of-Transformers)架构,将视觉推理、世界生成与动作预测集成于单一系统之中。与传统模型不同,Cosmos 3是一个完全开源的“全能模型”,原生支持视觉推理以及文本、图像、视频、环境音和动作在内的多模态生成。这种设计使得开发者能够基于一个强大的预训练基础,以更少的数据和更低的训练成本构建复杂的物理AI系统,例如机器人控制、自动驾驶仿真和具身智能代理。该模型的发布,显著降低了高精度物理AI应用的门槛,被视为推动机器人技术和自动系统研发民主化的关键一步。

核心要点

  • 英伟达发布开源物理AI基础模型Cosmos 3,采用混合专家变换器架构。
  • 该模型支持视觉推理及多模态生成,覆盖文本、图像、视频、声音与动作。
  • Cosmos 3旨在降低物理AI开发门槛,减少数据需求与训练成本。

Read more >