漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-12 talkingdev

苹果Vision Pro 上市量传闻中比之前的预测要紧缩得多

著名的苹果分析师郭明錤认为,在苹果视觉 Pro 上市当天,苹果公司将有 6 万到 8 万个 Apple Vision Pro 设备可用。这个数字比之前的预测要紧缩得多,这意味着苹果可能会面临供应短缺的问题。苹果视觉 Pro 是一款专业...

Read More
2023-12-19 talkingdev

Meta开放首个大规模第一人称视频数据集

视频理解是一个古老的领域,现在才开始获得成功。成功的主要推动因素是高质量的数据集。Meta的这项工作包括许多传感器数据源和手势。它为现有方法提供了基准性能。

Read More
2023-12-05 talkingdev

SAFE:一种用于模式识别的融合框架开源

SAFE是一种新的模式识别融合框架,它结合了预训练的视觉和语言模型,使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景,具有广泛的应用前景。在实现过程中...

Read More
2023-11-20 talkingdev

一份帮助了解学生行为的数据集

研究人员扩展了SCB-ST-Dataset4,该数据集记录了诸如举手、阅读和书写等活动,以更好地通过深度学习来了解和检测学生的课堂行为。这个数据集是通过在课堂上安装传感器来捕捉学生行为的。研究人员使用了不同的深度学...

Read More
2023-10-19 talkingdev

MonoSKD开源,一张图像实现3D物体检测

MonoSKD是一种革命性的方法,它使用一张图像就可以检测3D物体,有效地弥合了LiDAR和普通RGB模型之间的知识鸿沟。传统的3D物体检测需要使用多个传感器来捕捉物体的深度信息和其它特征,而MonoSKD仅需要一张图像就能完...

Read More
2023-10-17 talkingdev

论文:SupFusion提高LiDAR和相机检测能力

一篇发表在arXiv上的论文介绍了一种新技术SupFusion,它能够使激光雷达(LiDAR)和相机系统更好地协同工作,用于检测汽车或行人等物体。这项技术使用多任务学习方法,同时考虑激光雷达和相机的输出,将它们融合成更...

Read More
2023-09-26 talkingdev

通过被动摄像头增强深度估计的研究

这项研究提出了一种在被动摄像头中模拟主动立体感的方法,而无需使用物理图案投影仪。研究人员通过利用外部传感器的深度数据虚拟叠加图案,克服了传统设置的局限性。这种方法在各种数据集上都增强了立体算法和深度学...

Read More
2023-09-11 talkingdev

通过一张照片,精准定位篮球在3D空间的位置

本研究的作者们开发了一种新方法,只需要一张照片,就能准确地确定篮球在3D空间中的位置。这对于体育分析和机器人技术等领域来说,具有重大意义。对于传统的3D定位技术,通常需要多个相机或传感器才能实现精确定位,...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page