漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-25 talkingdev

论文:开放词汇注意力图谱革新图像分割技术

开放词汇注意力图谱(OVAM)是一种新兴的图像分割技术,它通过对类Stable Diffusion的文本到图像扩散模型进行改进,实现了对任意词汇生成注意力图的功能,打破了之前的限制。这意味着,通过OVAM,开发者和研究人员能...

Read More
2024-03-05 talkingdev

Smooth Diffusion-增强文本到图像扩散模型的潜在空间平滑度

一种名为Smooth Diffusion的新方法解决了文本到图像扩散模型的潜在空间平滑度挑战。该方法确保在输入微小调整时,图像呈现出一致和逐渐的变化。

Read More
2024-01-25 talkingdev

Google Chrome增加AI功能

谷歌正在增强Chrome的功能,包括在线文本编辑助手、多标签页自动整理和基于文本到图像扩散模型的自定义主题创建器等AI功能。

Read More
2023-12-12 talkingdev

使用预训练文本到图像扩散模型进行视频编辑

RAVE是一种利用现有文本到图像扩散模型来增强视频的视频编辑方法。这种方法可以在保持原始运动和结构的同时实现高质量的视频编辑。

Read More
2023-12-05 talkingdev

StyleGAN-嵌入式个性化图像生成技术

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型,提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性,更好地满足用户的需求。

Read More
2023-04-17 talkingdev

【技术新闻】C-LoRA方法在图像生成中取得重大突破

以下是本文的主要内容: - 文本到图像扩散模型在定制连续性概念时面临灾难性遗忘问题,导致过去概念的图像生成质量低下。 - 我们提出的C-LoRA方法通过持续自我正则化的低秩适应性克服了这个问题,在连续扩散方面优...

Read More
2023-04-14 talkingdev

C-LoRA:解决文本到图像扩散模型中的“灾难性遗忘”问题

以下是新闻内容的核心要点: - 文本到图像扩散模型在定制化时面临“灾难性遗忘”的问题,导致过去概念的图像生成质量较差。 - 研究人员提出了 C-LoRA 方法,通过持续自我正则化低秩适应来克服这个问题,在持续扩散方...

Read More