漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-12 talkingdev

OVFormer-引领开放词汇视频实例分割突破

近日,一种名为OVFormer的新方法在开放词汇视频实例分割(VIS)领域引起了广泛关注。该方法解决了该领域的关键问题,改善了嵌入对齐,并利用基于视频的训练来提高时间一致性。OVFormer的核心优势在于它的开放性词汇...

Read More
2024-05-28 talkingdev

复杂场景中的对象分割新突破

研究人员推出了层次语义解码与计数辅助(HDC)框架,以提升广义指代表达分割(GRES)。与以往方法不同,HDC框架通过跨粒度传递互补的模态信息,并聚合语义对应关系,从而实现更好的多层次解码。这一创新方法在复杂场...

Read More
2024-05-03 talkingdev

使用对抗调优技术进行图像分割:Meta AI推出ASAM模型

Meta AI最新推出的Segment Anything Model(简称SAM)是计算机视觉领域的一个重要的基础模型,该模型在图像分割方面表现出色,但在某些特定领域中却显得力不从心。为了解决这个问题,Meta AI推出了一项新的项目,即A...

Read More
2024-03-27 talkingdev

论文:SegRefiner模型无关解决方案提升对象分割精度

SegRefiner作为一种创新的模型无关解决方案,通过将细化过程视为数据生成过程,显著提升了各种分割任务中的对象掩膜质量。该技术通过离散扩散过程逐像素细化粗糙掩膜,从而提高分割和边界指标的精确度。这一方法的核...

Read More
2024-03-26 talkingdev

PSALM:面向图像分割任务的多模态模型扩展

PSALM是大型多模态模型(LMM)的扩展版本,通过引入一个掩码解码器和多功能输入模式,在各种图像分割任务中表现出色。这种方法不仅克服了仅限于文本输出的限制,而且还使模型能够有效理解和分类复杂图像。PSALM的创...

Read More
2024-03-04 talkingdev

UniVS:基于提示词的统一视频分割架构

UniVS是一种用于视频分割的统一架构,采用新颖的基于提示的方法应对各种分割任务的挑战。通过将提示特征作为查询并引入目标感知的提示交叉注意力层,UniVS消除了启发式的帧间匹配需求,可以无缝适应不同的视频分割场...

Read More
2024-01-23 talkingdev

OMG-Seg全能图像和视频分割模型

OMG-Seg是一种新的模型,可以使用单个高效的系统执行各种图像和视频分割任务。与使用每个任务的不同模型的传统方法不同,OMG-Seg从图像语义到交互式视频分割处理所有内容,是一个一站式解决方案,降低了复杂性并增强...

Read More
2024-01-08 talkingdev

论文:无人驾驶中的语义分割技术(CAINet)

研究人员开发了一种名为CAINet的新方法来改进RGB-T语义分割技术,这对于无人驾驶至关重要。该系统独特地结合了不同类型的数据,注重它们的互补性和全局上下文。CAINet使用了一个基于注意力机制的自适应特征融合模块...

Read More
  1. Next Page