漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-10 talkingdev

OccSora:驾驶场景中的4D占用生成技术

OccSora是一种基于扩散的4D占用生成模型,旨在改善长期的时间演变。这种模型是一种新颖的方法,可以生成时间和空间的占用,并且具有超前思考的能力。OccSora的引入将使驾驶场景的预测变得更为准确和实时,从而提高驾...

Read More
2023-11-15 talkingdev

使用视觉语言模型实现自主驾驶

本报告评估了GPT-4V在自主驾驶中的应用,重点关注其在场景理解、决策制定和实时响应方面的能力。GPT-4V是一种基于视觉语言模型的人工智能技术,能够自动识别和理解图像中的物体、道路、标志和其他要素,并作出相应的...

Read More
2023-08-02 talkingdev

自动驾驶中3D场景补全的新技术开源

Symphonies采用了一种独特的方法来完成自动驾驶中的3D场景补全,它可以填补来自激光雷达或图像等部分输入的空白。这种技术可以有效提高自动驾驶系统的精确性和稳定性,同时也能够提高驾驶安全性。通过这种新技术,无...

Read More