漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-18 talkingdev

ReasonVOS:基于世界知识的视频对象分割技术

推理视频对象分割(ReasonVOS)是一项新的任务,它使用隐式文本查询生成分割掩码。这需要复杂的推理和世界知识。在这个工作中,我们提出一个新的任务:基于世界知识的视频对象分割。这项任务的主要挑战在于,它需要...

Read More
2024-05-28 talkingdev

复杂场景中的对象分割新突破

研究人员推出了层次语义解码与计数辅助(HDC)框架,以提升广义指代表达分割(GRES)。与以往方法不同,HDC框架通过跨粒度传递互补的模态信息,并聚合语义对应关系,从而实现更好的多层次解码。这一创新方法在复杂场...

Read More
2024-03-27 talkingdev

论文:SegRefiner模型无关解决方案提升对象分割精度

SegRefiner作为一种创新的模型无关解决方案,通过将细化过程视为数据生成过程,显著提升了各种分割任务中的对象掩膜质量。该技术通过离散扩散过程逐像素细化粗糙掩膜,从而提高分割和边界指标的精确度。这一方法的核...

Read More
2023-07-28 talkingdev

HQTrack-高质量视频对象追踪和分割开源框架

这个仓库介绍了HQTrack,这是一个高质量的视频对象追踪框架,利用先进的感知算法来追踪单个和多个对象,同时精细化他们的边界。尽管只在有限的数据集上进行训练,HQTrack通过在不使用任何额外的数据增强或模型集成的...

Read More
2023-07-27 talkingdev

增强版视频对象分割方法:SgMg(GitHub 仓库)

这个GitHub仓库介绍了一个名为SgMg的新方法,改进了视频中所提到的对象分割过程。该方法解决了特性漂移的问题,利用视觉细节更好地优化分割。新方法还使得视频中多个对象的同时分割成为可能,使得这个过程更加快速和...

Read More