漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-29 talkingdev

SAM 2:图像和视频中的任意物体分割技术

最近,研究人员推出了一种新的图像和视频分割模型——SAM 2,能够从图像和视频中精确地分割出任何物体。该模型采用了全新的分割框架,能够利用少量训练数据进行高质量的物体分割。SAM 2 的分割精度得到了显著提高,比...

Read More
2024-07-02 talkingdev

UnSAM-无监督SAM自动图像分割技术开源

无监督SAM(UnSAM)是一种新型的全图像分割模型,它消除了对人工注释的需求。UnSAM通过结合自上而下和自下而上的聚类方法,识别视觉场景中的层次结构,采用一种分而治之的方法。在复杂的视觉场景中,这种方法可以更...

Read More
2024-05-03 talkingdev

使用对抗调优技术进行图像分割:Meta AI推出ASAM模型

Meta AI最新推出的Segment Anything Model(简称SAM)是计算机视觉领域的一个重要的基础模型,该模型在图像分割方面表现出色,但在某些特定领域中却显得力不从心。为了解决这个问题,Meta AI推出了一项新的项目,即A...

Read More
2024-04-15 talkingdev

xAI发布Grok-1.5视觉预览,性能媲美顶尖模型

xAI公司近日宣布,其最新旗舰模型Grok-1.5已具备视觉功能,与现有最先进模型相比肩,甚至在某些方面超越。Grok-1.5的推出,标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...

Read More
2024-03-27 talkingdev

论文:SegRefiner模型无关解决方案提升对象分割精度

SegRefiner作为一种创新的模型无关解决方案,通过将细化过程视为数据生成过程,显著提升了各种分割任务中的对象掩膜质量。该技术通过离散扩散过程逐像素细化粗糙掩膜,从而提高分割和边界指标的精确度。这一方法的核...

Read More
2024-03-26 talkingdev

PSALM:面向图像分割任务的多模态模型扩展

PSALM是大型多模态模型(LMM)的扩展版本,通过引入一个掩码解码器和多功能输入模式,在各种图像分割任务中表现出色。这种方法不仅克服了仅限于文本输出的限制,而且还使模型能够有效理解和分类复杂图像。PSALM的创...

Read More
2024-03-25 talkingdev

论文:开放词汇注意力图谱革新图像分割技术

开放词汇注意力图谱(OVAM)是一种新兴的图像分割技术,它通过对类Stable Diffusion的文本到图像扩散模型进行改进,实现了对任意词汇生成注意力图的功能,打破了之前的限制。这意味着,通过OVAM,开发者和研究人员能...

Read More
2024-02-15 talkingdev

论文:一种新的图像分割技术

研究人员引入了一种新的图像分割技术,只使用基本图像标签即可识别图像特定部分,例如狗。他们通过引入一种新的方法来解决网络识别同一对象的多个实例的挑战,并优化了该过程,降低了错误率。

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page