漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-19 talkingdev

论文:图像的子对象标记化,革新视觉模型理解方式

子对象标记化为视觉模型理解图像开辟了新的途径。不同于将图像划分为固定的方形片段,采用子对象标记化的模型会从有意义的段落,例如物体的部分来观察图像。这种新的视觉模型理解方式,相比传统的划分方案,可能更加...

Read More
2024-05-17 talkingdev

据报道,Meta正在研发配备摄像头的AI耳机

据报道,Meta正在研发一款配备摄像头的AI耳机。这款内部代号为'Camerabuds'的耳机将利用AI能力实现实时物体识别和外语翻译。Meta的领导层认为,AI耳机是可穿戴技术发展的下一个逻辑步骤。他们已经与位于堪萨斯州的电...

Read More
2024-05-14 talkingdev

Meta据称正在开发配备摄像头的AI耳机

据报道,Meta正在开发配备摄像头的AI耳机。这款耳机内部代号为'Camerabuds',将利用人工智能功能进行实时物体识别和外语翻译。Meta的领导层认为,配备人工智能的耳机是可穿戴技术演进的下一个逻辑步骤。它与堪萨斯州...

Read More
2024-04-09 talkingdev

论文:Seg-NN框架简化3D物体识别流程

Seg-NN框架通过去除对大量预训练的需求,极大地优化了3D分割的流程。这一创新使得模型能够快速适应新的、未见过的类别,同时避免了通常存在的领域差异问题。这一技术突破不仅加快了3D物体识别的速度,还提高了模型的...

Read More
2024-04-04 talkingdev

SeaBird:新型3D检测技术突破大型物体识别难题

SeaBird,一种创新的3D检测方法,专门针对大型物体的识别而设计,相较于传统的单目检测器在此类场景下表现更加出色。该技术的出现,为大型物体的准确检测提供了新的解决方案。在实际应用中,SeaBird能够高效地识别和...

Read More
2024-03-29 talkingdev

Meta为雷朋智能眼镜引入AI功能

Meta公司正计划为其雷朋品牌的智能眼镜增加人工智能功能。这些功能将包括实时翻译以及通过语音命令激活的物体、动物和纪念碑识别。这一创新将为用户带来更加便捷的交互体验,使得智能眼镜不仅仅是一种时尚配饰,更是...

Read More
2024-02-26 talkingdev

nxtp-采用下一个标记预测的物体识别方法

一种使用语言解码器进行物体识别的新方法。该方法涉及从图像嵌入中预测文本标记,并利用专门的非因果注意掩模。它可以实现多标签的高效并行采样。

Read More
2023-10-06 talkingdev

CoDA开源:可智能识别和命名3D场景中的新物体

在3D场景中检测和命名新物体一直是一个艰巨的挑战。然而,最近一个名为CoDA的项目提出了一种新的解决方法。该方法通过智能猜测新物体可能出现的位置,然后将这些物体的特征与图片和文本进行匹配,所有这些操作都在一...

Read More
  1. Next Page