漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-30 talkingdev

论文:利用扩散模型提升安全性:DiffSmooth模型稳健新纪元

科研人员正在探索一种名为“扩散模型”的新方法,以增强已进行训练的模型的强度。这种新方法被命名为“DiffSmooth”,通过使用扩散清理数据,然后利用特殊的平滑过程让模型变得更加可靠。这一创新方法的提出,意味着我们...

Read More
2023-08-29 talkingdev

双阶段图模型实现多摄像头物体跟踪

最新研究引入了一种新的图模型,专注于多摄像头多物体跟踪(MC-MOT)的空间和时间问题。与之前的方法不同,该模型首先在不同的摄像头之间连接物体,然后利用该信息进行时间跟踪,使跟踪更加准确,适用于实际场景。这...

Read More
2023-08-25 talkingdev

论文:LiDAR点追踪3D物体的新方法

大多数计算机视觉工具在使用LiDAR点追踪3D物体时,由于干扰或未注意到长期运动,常常遇到困难。为了解决这些问题,MTM-Tracker混合使用了两种方法,并分为两个阶段进行工作。在第一阶段,MTM-Tracker使用基于模型的...

Read More
2023-08-23 talkingdev

优化3D场景理解:DReg-NeRF的新技术将改变现状

神经辐射场(NeRF)在计算机视觉领域已经成为热门话题,然而如何有效地将多个NeRF结合在一起仍然是一个挑战。为了解决这个问题,研究团队开发出了一种名为DReg-NeRF的新方法。DReg-NeRF能有效提取NeRF中的特征,使用...

Read More
2023-08-22 talkingdev

RLIPv2:一个更优秀的语言视觉模型

RLIPv1是一种帮助计算机将图像与描述性词语相连接的方法,但是它存在一些问题,尤其是运行缓慢和数据缺乏。这篇新的论文介绍了RLIPv2,这是一个更快速的版本,它使用了一种新的工具ALIF来更好地融合图像和词语。同时...

Read More
2023-08-21 talkingdev

论文:高效评估文字至图像生成的新方法

目前,评价从文本生成的图像质量的方法存在一些问题,如无法真实捕获图像的美观程度或与文本的匹配程度。最新的研究论文介绍了一种新的方法,该方法可以估计生成的图像与给定文本的匹配程度,重点关注图像的最重要部...

Read More
2023-08-18 talkingdev

KernelWarehouse提出一种构建卷积核的更智能方式

KernelWarehouse提出了一种新的动态卷积方法,通过更高效地分解和重组卷积核,为计算机视觉带来了新的可能。这种方法通过在各层之间巧妙地共享和混合预定义的部分,可以使用更少的参数,实现更大的灵活性和强大的功...

Read More
2023-08-17 talkingdev

SPP开源,利用LLMs增强问题解决能力

近日,一项研究引入了一种名为Solo Performance Prompting(SPP)的方法。该方法利用LLMs中的多个角色模拟认知协同,这是一种提高问题解决能力的协作过程。通过使用经过精细调整的角色,SPP使LLMs能够处理需要深度领...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page