SDXL是一款出色且开放的扩散模型,其搭载了全套LLM嵌入器(Hugging Face Hub),能够展现出强大的文本理解能力。这款模型的训练过程是从零开始的,开发者们通过将LLM嵌入到模型中,来增强其对文本内容的理解和解析能...
Read MoreSakana AI近日发布了EvoSDXL-JP,这是一款为日语指令优化的高速图像生成模型,采用了一种革新的模型融合方法。与现有模型相比,EvoSDXL-JP的推断速度提高了十倍,并且性能卓越。这款模型非常适合在日本的教育领域使...
Read MoreStable Cascade模型是一种新的仅用于研究的文本到图像模型,其在美学、提示忠实度和文本质量方面优于SDXL。它是使用Würstchen架构进行训练的,并具有多步架构,使调整变得容易。该模型的稳定性能够有效地提高图像生...
Read More稳定AI发布了一款新模型SDXL Turbo,可以在207ms内生成高分辨率图像。该模型不使用LCM,而是采用一种称为对抗扩散蒸馏的新颖蒸馏技术。该模型的权重和代码已被用于研究中。
Read More原始稳定扩散模型的创新之一是在扩散过程中使用较小的潜在空间。这意味着扩散不是发生在像素上,而是在某种压缩的图像表示上。本文深入探讨了一些解释SDXL潜在空间的方法。
Read More研究人员发现,当前领先的开源文本图像模型SDXL在推理时间上有了显著的加速,其速度提升了60%,同时体积缩小了50%。研究人员声称,在使用中,图像质量只有轻微的降低。
Read MoreSDXL是一种最先进的图像生成模型,虽然强大,但运行速度较慢。然而,Google与HuggingFace最近在Google的研究语言Jax中展示了它在新型TPU芯片上的运行速度。通过这种新的硬件加速,SDXL的性能得到了极大的提升,可以...
Read More