图像扩散模型的相关内容 - 漫话开发者

2024-03-25 talkingdev

论文：开放词汇注意力图谱革新图像分割技术

开放词汇注意力图谱（OVAM）是一种新兴的图像分割技术，它通过对类Stable Diffusion的文本到图像扩散模型进行改进，实现了对任意词汇生成注意力图的功能，打破了之前的限制。这意味着，通过OVAM，开发者和研究人员能...

2024-03-05 talkingdev

一种名为Smooth Diffusion的新方法解决了文本到图像扩散模型的潜在空间平滑度挑战。该方法确保在输入微小调整时，图像呈现出一致和逐渐的变化。

2024-01-25 talkingdev

谷歌正在增强Chrome的功能，包括在线文本编辑助手、多标签页自动整理和基于文本到图像扩散模型的自定义主题创建器等AI功能。

2024-01-08 talkingdev

MUSE是一种使用Transformers的掩蔽图像生成模型。HuggingFace和Stability AI已经合作开源复现该模型，并发布了训练代码、模型检查点和论文。虽然这些模型的训练时间不如一些最好的图像扩散模型长，但它们显示出了很...

2023-12-12 talkingdev

RAVE是一种利用现有文本到图像扩散模型来增强视频的视频编辑方法。这种方法可以在保持原始运动和结构的同时实现高质量的视频编辑。

2023-12-05 talkingdev

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型，提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性，更好地满足用户的需求。

2023-10-27 talkingdev

最受欢迎的扩散模型，如稳定扩散，已经在各种数据上进行了训练，但其中很多数据受到不同的版权限制。MosaicML提出的这种新模型纯粹基于创意共享数据进行训练，其性能与SD2相当，并且只需要训练数据的一小部分。

2023-04-17 talkingdev

以下是本文的主要内容： - 文本到图像扩散模型在定制连续性概念时面临灾难性遗忘问题，导致过去概念的图像生成质量低下。 - 我们提出的C-LoRA方法通过持续自我正则化的低秩适应性克服了这个问题，在连续扩散方面优...