Diffusion的相关内容 - 漫话开发者

2024-10-16 talkingdev

线性扩散变换器助力高效高分辨率图像合成

近日，研究人员提出了一种高效的线性扩散变换器（linear diffusion transformer），该技术显著提升了高分辨率图像合成的效率。传统的图像合成方法通常面临生成速度慢和计算资源消耗大的问题，而线性扩散变换器通过优...

2024-10-13 talkingdev

扩散技术在世界建模领域的应用正在引起广泛关注。通过使用先进的LLM和agent模型，研究人员能够生成更为精准和高效的世界模型。这种技术不仅提升了数据处理的速度，还增强了模型在复杂环境中的表现能力。特别是在嵌入...

2024-07-16 talkingdev

LightenDiffusion是一种新的技术，它利用扩散模型和Retinex理论来改善低光照下的图像。这种技术通过模拟自然光的扩散过程，以及使用Retinex理论来分离图像中的光照和反射成分，从而提高图像的亮度和清晰度。LightenD...

2024-07-11 talkingdev

最近，GitHub仓库发布了一款名为minRF的新工具。这个工具主要使用了可扩展的矩形流转换器，部分用于Stable Diffusion 3。这个仓库是一种最小化实现，同时也包括muP超参数扫描功能。可扩展的矩形流转换器是一种强大的...

2024-07-08 talkingdev

SDXL是一款出色且开放的扩散模型，其搭载了全套LLM嵌入器（Hugging Face Hub），能够展现出强大的文本理解能力。这款模型的训练过程是从零开始的，开发者们通过将LLM嵌入到模型中，来增强其对文本内容的理解和解析能...

2024-07-03 talkingdev

即时风格+是一种新兴的技术，它使用现代扩散模型和内容嵌入器进行风格转换。扩散模型是一种强大的机器学习工具，能够生成高质量的图像。内容嵌入器则是一种特殊的算法，能够从图像中提取出有意义的特征。结合这两种...

2024-06-27 talkingdev

近日，一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器（Trajectory Diffusion Transformer）和多视图...

2024-05-24 talkingdev

该项目推出了一种用于遥感图像变化描述的新型概率扩散模型（RSICC）。这一模型的引入旨在通过对时间推移中的环境变化进行描述，提高遥感图像的解读能力。遥感图像变化描述（RSICC）技术在环境监测、灾害评估及土地利...

2024-05-16 talkingdev

扰动注意力指引（PAG）是一种提升扩散模型生成图像质量的新方法，无需额外的训练或外部模块。通过创新地操作模型内部的自我关注机制，PAG显著提高了无条件样本和条件样本的结构和保真度。扩散模型一直以来都是生成对...

2024-05-16 talkingdev

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆，特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道，为持续的模型改进提供了可能性。而这一突破性的发展，不仅提升了英汉文本...