漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-12 talkingdev

OVFormer-引领开放词汇视频实例分割突破

近日,一种名为OVFormer的新方法在开放词汇视频实例分割(VIS)领域引起了广泛关注。该方法解决了该领域的关键问题,改善了嵌入对齐,并利用基于视频的训练来提高时间一致性。OVFormer的核心优势在于它的开放性词汇...

Read More
2024-04-05 talkingdev

YouTube CEO 表示使用平台视频训练 OpenAI 的文本到视频生成器将违反服务条款

YouTube 首席执行官 Neal Mohan 近日表示,使用该平台的视频内容来训练 OpenAI 的 Sora 文本到视频生成器将违反 YouTube 的服务条款。尽管 Neal Mohan 没有直接证据表明此类训练已经发生,但他的声明明确了 YouTube...

Read More
2024-03-04 talkingdev

Genie世界模型:可生成交互式环境

Google DeepMind的Genie是一个基础的世界模型,通过在互联网视频上进行训练,可以从合成图像、照片甚至草图中生成各种可玩(动作可控)的环境。该模型使用了深度强化学习和生成式建模技术,可以为游戏开发、虚拟现实...

Read More
2024-02-19 talkingdev

Meta发布V-JEPA模型,实现更高效的自监督模型训练

Meta的副总裁兼首席人工智能科学家Yann LeCun曾表示,我们需要更多的数据有效的自监督模型来实现通用智能。这项工作是朝着这个目标迈出的一步,通过对视频进行训练,让模型理解世界的方方面面。这些模型已经可以公开...

Read More