Diffusion的相关内容 - 漫话开发者

2024-03-05 talkingdev

Smooth Diffusion-增强文本到图像扩散模型的潜在空间平滑度

一种名为Smooth Diffusion的新方法解决了文本到图像扩散模型的潜在空间平滑度挑战。该方法确保在输入微小调整时，图像呈现出一致和逐渐的变化。

2024-02-26 talkingdev

Stability AI宣布推出Stable Diffusion 3，这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型，参数范围从8亿到80亿，这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...

2024-01-22 talkingdev

随着最近将扩散模型用于各种其他视觉任务的趋势，本研究改进了超分辨率的训练稳定性和缩放。

2024-01-16 talkingdev

PixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度，并采用ControlNet样式提示实现更好的控制。

2024-01-09 talkingdev

DiffusionEdge是一种新颖的边缘检测模型，它集成了扩散概率模型，可以在资源有效的同时提供更准确和清晰的边缘图。传统的边缘检测模型对于噪声和边缘不清晰的情况表现得不够稳定。DiffusionEdge的扩散模型可以帮助减...

2023-12-08 talkingdev

研究人员开发了Diffusion-SS3D，这是一种改进半监督3D物体检测的新方法，使用扩散模型添加噪声到3D空间中的物体大小和类别标签分布，然后使用扩散模型去噪和生成更好的边界框输出。

2023-12-07 talkingdev

该项目探索了视觉转换器在基于扩散的生成学习中的有效性，揭示了Diffusion Vision Transformers（DiffiT）。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像，具有非常好的...

2023-12-06 talkingdev

Diffusion Models as Prior (DMP)是一种新的方法，它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务，例如3D属性估计和语义分割，在有限的训练数据下表现优...