漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-18 talkingdev

ReasonVOS:基于世界知识的视频对象分割技术

推理视频对象分割(ReasonVOS)是一项新的任务,它使用隐式文本查询生成分割掩码。这需要复杂的推理和世界知识。在这个工作中,我们提出一个新的任务:基于世界知识的视频对象分割。这项任务的主要挑战在于,它需要...

Read More
2024-07-18 talkingdev

LiDAR语义分割:SFPNet新方法实现跨技术通用

SFPNet是一种新方法,旨在实现对不同类型的LiDAR技术的泛化。该方法采用稀疏焦点调制技术,而非传统的窗口注意力机制,从而实现了对多级上下文的提取和动态聚合。这一全新的处理方式,使得SFPNet在LiDAR语义分割领域...

Read More
2024-07-12 talkingdev

OVFormer-引领开放词汇视频实例分割突破

近日,一种名为OVFormer的新方法在开放词汇视频实例分割(VIS)领域引起了广泛关注。该方法解决了该领域的关键问题,改善了嵌入对齐,并利用基于视频的训练来提高时间一致性。OVFormer的核心优势在于它的开放性词汇...

Read More
2024-07-05 talkingdev

PTQ4SAM:用后训练量化使SAM更实用

PTQ4SAM是一个新的框架,旨在减少大规模Segment Anything Model(SAM)的内存和计算需求。SAM是一个全新的大规模模型,但其大规模的特性也使得其在实际应用中面临着严峻的挑战,尤其是在内存和计算资源上的需求。而P...

Read More
2024-07-02 talkingdev

UnSAM-无监督SAM自动图像分割技术开源

无监督SAM(UnSAM)是一种新型的全图像分割模型,它消除了对人工注释的需求。UnSAM通过结合自上而下和自下而上的聚类方法,识别视觉场景中的层次结构,采用一种分而治之的方法。在复杂的视觉场景中,这种方法可以更...

Read More
2024-06-28 talkingdev

Point-SAM:互动引导下的3D分割变革模型

为满足对详细3D数据的日益增长的需求,研究人员推出了Point-SAM,这是一种基于变革者的3D分割模型。这个模型将大大提高3D数据处理的效率和精度。与传统的3D分割技术相比,Point-SAM能够提供更精细的数据,从而更好地...

Read More
2024-06-19 talkingdev

论文:图像的子对象标记化,革新视觉模型理解方式

子对象标记化为视觉模型理解图像开辟了新的途径。不同于将图像划分为固定的方形片段,采用子对象标记化的模型会从有意义的段落,例如物体的部分来观察图像。这种新的视觉模型理解方式,相比传统的划分方案,可能更加...

Read More
2024-05-28 talkingdev

论文:多维度适应性分类器革新语义分割技术

一种新的语义和空间适应性(SSA)分类器被引入,以解决语义分割中的局限性。这种创新方法利用粗糙的掩码来指导原型的调整,从而增强细粒度识别并明确掩码边界。SSA分类器通过结合语义和空间信息,使得模型在处理复杂...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page