漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

Meta发布新型文本-图像-文本模型

talkingdev • 2023-07-17

1240596 views

Meta最近发布了一种新型模型,该模型的工作原理与GPT系列的解码器仅Transformer相似,都是一次预测一个令牌。然而,如果你将交错的文本和图像视为令牌,这种模型就可以从文本生成图像,反之亦然。更令人惊奇的是,该模型还能生成手部图像。这个创新的模型开启了一种全新的视觉和文字交互方式,预示着AI技术在理解和创造视觉内容方面的巨大潜力。

核心要点

  • Meta发布了一种新型文本-图像-文本模型。
  • 该模型的工作原理与GPT系列的解码器仅Transformer相似,一次预测一个令牌。
  • 这种模型可以从文本生成图像,反之亦然,甚至可以生成手部图像。

Read more >