文本到图像的相关内容 - 漫话开发者

2023-06-08 talkingdev

文本到图像模型中的紧急对应关系

最近，研究人员发现文本图像模型（如Stable Diffusion）可以具有紧急对应关系检测能力。这些对应关系是图像中的语义特征，即表示相同的事物，例如人的鼻子，动物的耳朵，汽车的轮胎等。通过巧妙的算法，可以从各种图...

2023-06-06 talkingdev

近日，一项名为ViCo的新技术问世，其可以根据文本描述生成逼真的图像，并且能够从仅有的几个样本中捕捉到新概念的细节。与其他方法不同，ViCo对系统资源的消耗较小，不需要对原始模型的参数进行微调，但它仍然通过专...

2023-06-05 talkingdev

在人工智能领域中，研究人员一直在探索如何利用计算机生成逼真的图像。在这个过程中，DreamBooth 系列研究的下一个步骤——StyleDrop 已经发布。这个开源项目提供了一种新的方法，只需要使用单个参考图像，就可以在任...

2023-05-31 talkingdev

今天，我们向大家介绍一个名为Threestudio的开源项目。这个项目采用了先进的2D文本到图像生成模型，从文本提示、单张图像和少量样本图像中创建3D内容的统一框架。以下是该框架的三个核心要点： - Threestudio利用...

2023-05-19 talkingdev

近日，研究人员开发出一种名为FastComposer的新方法，能够快速创建个性化的多主题图像，避免了其他方法中耗时的微调。不仅如此，FastComposer还能够处理多主题生成中的混合问题，并且可以更快地生成不同风格、动作和...

2023-05-05 talkingdev

研究人员调查了在富文本中发现的各种格式元素（例如字体大小、颜色、样式和脚注）的使用，以生成从文本到图像的过程。他们的方法允许轻松控制本地样式、准确地创建颜色，并在处理长文本提示时提供额外信息。通过利用...

2023-05-04 talkingdev

一个名为“Pick-a-Pic”的网络应用程序被创建，让人们生成图像并分享他们的喜好，从而形成了一个大型的开放数据集，用于训练一个智能评分系统PickScore。PickScore非常擅长预测人们的喜好，并且在评估文本到图像模型方...

2023-04-17 talkingdev

以下是本文的主要内容： - 文本到图像扩散模型在定制连续性概念时面临灾难性遗忘问题，导致过去概念的图像生成质量低下。 - 我们提出的C-LoRA方法通过持续自我正则化的低秩适应性克服了这个问题，在连续扩散方面优...