开源|字节跳动Seed团队发布Depth Anything 3:通用单/多视图深度估计新突破
thinkindev • 2025-11-17
1998 views
字节跳动Seed团队在GitHub开源了Depth Anything 3(DA3)项目,这是深度估计领域的重要进展。该模型通过纯Transformer架构和创新的深度射线表示法,实现了无需相机位姿信息的单视图或多视图图像空间一致性深度估计。其技术核心在于将复杂的几何建模简化为统一的深度射线预测问题,不仅降低了模型复杂度,还显著提升了跨场景泛化能力。这一突破对自动驾驶、机器人导航、AR/VR等依赖三维感知的领域具有重要价值,其开源策略更将加速相关技术的产业化落地。目前项目已吸引大量开发者关注,预计将推动边缘设备实时深度计算、神经渲染等方向的协同创新。
核心要点
- 支持单视图/多视图的零相机位姿深度估计
- 采用纯Transformer骨干网络与统一深度射线表示法
- 开源模型架构简化训练流程并提升跨场景适应性