自动驾驶的相关内容 — 漫话开发者

英伟达今日正式发布Cosmos 3，这是一款面向物理AI的开源世界基础模型，标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器（Mixture-of-Transformers）架构，将视觉推理、世界生成与动作预测集成于单一系统之中。与传统模型不同，Cosmos 3是一个完全开源的“全能模型”，原生支持视觉推理以及文本、图像、视频、环境音和动作在内的多模态生成。这种设计使得开发者能够基于一个强大的预训练基础，以更少的数据和更低的训练成本构建复杂的物理AI系统，例如机器人控制、自动驾驶仿真和具身智能代理。该模型的发布，显著降低了高精度物理AI应用的门槛，被视为推动机器人技术和自动系统研发民主化的关键一步。