开源|NitroGen:基于互联网游戏视频训练的通用游戏智能体基础模型发布
thinkindev • 2026-01-08
9309 views
近日,由MineDojo团队在GitHub上开源的项目NitroGen引起了人工智能与游戏交叉领域的广泛关注。该项目提出了一个旨在成为“通用游戏智能体”的基础模型。其核心创新在于,模型并非针对单一游戏进行专门训练,而是通过大规模学习互联网上公开的游戏玩法视频,直接从像素画面中学习并预测对应的控制器操作指令。这种“从像素到动作”的端到端学习范式,使其具备了强大的视觉理解和动作生成能力。更关键的是,研究团队声称该模型能够通过“后训练”技术,快速适应其训练数据中未曾出现过的全新游戏,这标志着向构建真正通用、可迁移的游戏AI迈出了重要一步。此类技术不仅对开发更智能的非玩家角色、游戏测试自动化有直接应用价值,其背后关于多任务学习、视觉-动作表征以及小样本适应的方法论,也对机器人学、自动驾驶等需要从视觉输入中规划连续控制动作的领域具有深远的启发意义。
核心要点
- NitroGen是一个通过海量互联网游戏视频训练而成的通用游戏智能体基础模型。
- 模型具备从原始游戏画面(像素)直接预测玩家控制器动作的能力,实现了端到端学习。
- 该模型宣称可通过“后训练”技术快速适应未见过的游戏,展示了强大的泛化与迁移潜力。