Meta开源SAM 3:多模态提示实现智能分割新突破
thinkindev • 2025-11-20
2813 views
Meta公司最新开源的Segment Anything Model 3(SAM 3)标志着图像分割技术进入全新发展阶段。该版本突破性地融合了文本与视觉双重提示能力,用户既可通过文字描述指定分割目标,也能通过点击、框选等视觉交互方式精确定位。更值得关注的是,SAM 3首次实现了视频序列中的动态对象追踪与分割,能够跨帧持续追踪特定物体并保持分割一致性,这将极大提升视频编辑、自动驾驶视觉感知、医疗影像分析等领域的处理效率。该模型采用先进的动态权重分配机制,在保持轻量化架构的同时显著提升了复杂场景下的分割精度。作为计算机视觉基础模型的重要突破,SAM 3的开源将推动AR/VR内容创作、工业质检、遥感图像分析等众多行业的智能化升级,为多模态人工智能应用提供强大的视觉理解基石。
核心要点
- 支持文本与视觉双重提示机制,实现更灵活的分割交互方式
- 新增视频对象追踪功能,可跨帧保持分割一致性
- 采用动态权重分配技术,在精度与效率间取得突破性平衡