微信扫码实时跟踪AI前沿
推理视频对象分割(ReasonVOS)是一项新的任务,它使用隐式文本查询生成分割掩码。这需要复杂的推理和世界知识。在这个工作中,我们提出一个新的任务:基于世界知识的视频对象分割。这项任务的主要挑战在于,它需要...