漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

噪声调度改进了视频扩散技术

talkingdev • 2023-10-25

952221 views

单个提示生成单个图像通常很好,但在生成视频时由于帧之间的时间变化而失败。 然而,更改文本时的一致性非常具有挑战性。 这项工作解决了这两个问题,并利用扩散技术实现了长达512帧的生成。

核心要点

  • 利用噪声调度改进视频扩散技术
  • 提高生成长度,可达512帧
  • 解决了视频生成中的文本一致性问题

Read more >