空间和时间的相关内容 - 漫话开发者

2024-05-21 talkingdev

PSG-4D全景场景图生成，让AI理解时空世界的技术开源

PSG-4D是一种全新的表示法，帮助AI理解空间和时间的四维世界。这种技术的GitHub Repo已经开源。该技术能够生成4D全景场景图，通过这种场景图，AI不仅能够理解物体的三维空间位置，还能理解物体随时间的变化。这是一...

2024-04-28 talkingdev

MIM4D 是一种全新的方法，通过使用双重遮罩图像建模在自动驾驶中提升视觉表现学习。这种方法从多视角视频中捕获空间和时间的详细信息，大大提升了自动驾驶的性能和效率。MIM4D 的开源代码已经在GitHub上发布，对于自...

2024-02-21 talkingdev

近日，一种新的Temporal Dilated Video Transformer (TDViT)技术被发布，旨在提高稠密视频任务的分析能力，如逐帧视频对象检测。该技术采用多头自注意力机制，可进行多层次、多尺度的特征提取，同时利用空间和时间的...

2023-08-31 talkingdev

现有的理解3D人体姿态的方法主要关注的是身体各部分在空间中的关系，但往往忽略了它们随着时间的变化。这种新方法同时考虑了空间和时间，使其在理解姿态方面，特别是身体某些部分被遮挡或不清晰的时候，表现得更为优...

2023-08-29 talkingdev

最新研究引入了一种新的图模型，专注于多摄像头多物体跟踪（MC-MOT）的空间和时间问题。与之前的方法不同，该模型首先在不同的摄像头之间连接物体，然后利用该信息进行时间跟踪，使跟踪更加准确，适用于实际场景。这...