漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-29 talkingdev

双阶段图模型实现多摄像头物体跟踪

最新研究引入了一种新的图模型,专注于多摄像头多物体跟踪(MC-MOT)的空间和时间问题。与之前的方法不同,该模型首先在不同的摄像头之间连接物体,然后利用该信息进行时间跟踪,使跟踪更加准确,适用于实际场景。这...

Read More
2023-08-25 talkingdev

论文:LiDAR点追踪3D物体的新方法

大多数计算机视觉工具在使用LiDAR点追踪3D物体时,由于干扰或未注意到长期运动,常常遇到困难。为了解决这些问题,MTM-Tracker混合使用了两种方法,并分为两个阶段进行工作。在第一阶段,MTM-Tracker使用基于模型的...

Read More
2023-08-24 talkingdev

Clip4Cir开源-使用CLIP和标题改进图像搜索

该项目引入了一种搜索图像的方法,该图像看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

Read More
2023-08-24 talkingdev

TOPIC开源,多目标跟踪新突破并发布复杂动作数据集BEE23

近日,一群研究者开发出一套名为TOPIC的新系统,能够通过运动和外观线索有效地在视频中跟踪多个对象。TOPIC系统不仅能够处理复杂的运动,而且还可以有效处理对象的外观变化,显著提高了多目标跟踪的准确性和效率。为...

Read More
2023-08-23 talkingdev

CodiumAI:能在IDE中生成测试代码的AI工具

CodiumAI是一款强大的人工智能工具,它通过分析您的代码、文档字符串和注释,并与您进行交互,可以在您编写代码的同时建议进行测试。您只需要接受并提交这些测试即可。CodiumAI支持JetBrains或VS Code,只需简单设置...

Read More
2023-08-22 talkingdev

RLIPv2:一个更优秀的语言视觉模型

RLIPv1是一种帮助计算机将图像与描述性词语相连接的方法,但是它存在一些问题,尤其是运行缓慢和数据缺乏。这篇新的论文介绍了RLIPv2,这是一个更快速的版本,它使用了一种新的工具ALIF来更好地融合图像和词语。同时...

Read More
2023-08-11 talkingdev

论文:利用DETR改进3D物体检测的新方法

当前的3D物体检测器常常会误解数据,使其关注点距离目标物体较远。为了解决这个问题,一种名为“3D顶点相对位置编码”的新方法已经被开发出来。这种新方法可以引导检测器的注意力集中于靠近目标物体的点。这不仅提高了...

Read More
2023-08-11 talkingdev

提升视觉-语言模型精度的新策略

这个代码库介绍了一种改善视觉-语言模型,特别是在详细属性检测和图像内部位置定位任务中的表现的多任务策略。这种策略以视觉-语言模型CLIP为例,展示了如何通过多任务学习提升模型的表现。通过这种方式,模型可以更...

Read More
  1. Prev Page
  2. 28
  3. 29
  4. 30
  5. Next Page