图像生成的相关内容 - 漫话开发者

2023-12-13 talkingdev

DALL-E 3加入海象：提示工程的探究

DALL-E 3是一项有趣的实验，它展示了不同的提示如何生成不同的图像，以及后续的提示如何进一步完善这些图像。这项实验为人工智能领域的自然语言处理提供了新的思路和方法。

2023-12-11 talkingdev

Kandinsky 3.0是一种文本转图像模型，它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络（GAN）模型，通过学习图像语义和语法，从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...

2023-12-08 talkingdev

Meta发布了一个名为Imagine的独立图像生成器，其拥有自己的网站，使用生成式人工智能从文本提示中创建图像。该工具使用GAN（生成式对抗网络）技术，可以生成高度逼真的图像，用户只需输入文本提示，就可以生成与之相...

2023-12-07 talkingdev

Zero123++是一个使用扩散原理从单个输入图像生成一致的多视图图像的模型。通过利用预训练的2D模型，Zero123++解决了纹理质量和对齐问题等挑战。

2023-12-07 talkingdev

该项目探索了视觉转换器在基于扩散的生成学习中的有效性，揭示了Diffusion Vision Transformers（DiffiT）。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像，具有非常好的...

2023-12-06 talkingdev

IMMA是一种新技术，可以为文本转图模型提供保护，以防止被恶意适应生成有害内容。IMMA是一种基于信息瓶颈原理的技术，可以将文本编码为低维向量，然后将其与图像编码结合起来，以生成所需的图像。此技术不仅可以防止...

2023-12-05 talkingdev

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型，提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性，更好地满足用户的需求。

2023-11-29 talkingdev

研究人员已经设计出一种独特的圆形混合方法来解决创建无缝360度全景图像的长期难题。这种技术是他们从文本和单张图像生成全景图像的创新模型的关键特征。