[开源] 视觉几何基础Transformer (VGGT) GitHub 项目发布

视觉几何基础Transformer（Visual Geometry Grounded Transformer，简称VGGT）是一种前馈神经网络，能够直接从场景的一个、几个甚至数百个视角中推断出所有关键的3D属性，包括外部和内部相机参数、点云图、深度图以及3D点轨迹，且这一过程仅需数秒即可完成。这一创新技术由Facebook Research团队开发，并已在GitHub上开源。VGGT的出现标志着在计算机视觉领域，尤其是3D场景理解和重建方面，取得了重大突破。该技术的应用前景广泛，从增强现实（AR）到自动驾驶，乃至机器人视觉导航等多个高科技领域都将从中受益。VGGT的高效性和准确性，使其成为未来3D视觉技术发展的重要基石。