文本到图像生成的相关内容 - 漫话开发者

2024-06-26 talkingdev

EvalAlign：一种文本到图像生成模型评估指标

EvalAlign是一种新型的用于改进文本到图像生成模型评估的指标。与现有的评估指标不同，EvalAlign提供了细粒度的准确性和稳定性。它主要关注图像的真实性和文本与图像的对齐性。与其他评估指标不同的是，EvalAlign不...

2024-05-17 talkingdev

在技术领域，一种名为MasterWeaver的新方法被提出，以提高个性化文本到图像生成模型的性能。这种技术的出现，无疑为AI领域的图像生成技术开辟了新的可能性，使得文本到图像的转换过程更为精确和个性化。MasterWeaver...

2024-05-16 talkingdev

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆，特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道，为持续的模型改进提供了可能性。而这一突破性的发展，不仅提升了英汉文本...

2024-02-15 talkingdev

Stable Cascade模型是一种新的仅用于研究的文本到图像模型，其在美学、提示忠实度和文本质量方面优于SDXL。它是使用Würstchen架构进行训练的，并具有多步架构，使调整变得容易。该模型的稳定性能够有效地提高图像生...

2024-01-25 talkingdev

最近，由阿里达摩院、南京邮电大学、南京大学等机构合作开发的RPG框架在GitHub上开源。该框架采用“Recaption、Plan和Generate”的方法来改进文本到图像生成，将复杂的图像创建任务分解为更简单的任务，从而在处理多个...

2023-10-16 talkingdev

研究人员正在改进我们与文本到图像模型的交互方式，例如Midjourney和Stable Diffusion，这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”，使人们可以自然地与大型语言模型进行交互，以获得更...

2023-09-21 talkingdev

OpenAI的最新文本到图像生成器DALL-E 3将于10月初向ChatGPT Plus和企业客户提供。OpenAI尚未发布有关该模型的任何技术细节。DALL-E 3可以更有效地精细化处理，例如手部细节，并可以创建引人入胜的图像，无需任何hack...

2023-09-20 talkingdev

将长篇文字转化为图像一直是一项艰巨的任务，尤其当需要展示的项目或细节众多时。然而，一种新的方法打破了这个困扰。这种新的方法将长篇描述分解成更简单的步骤，确保每个细节在图像中的位置都恰到好处，从而为从文...

2023-09-14 talkingdev

研究人员已经找到一种方法，通过使用名为校正流（Rectified Flow）的技术，加快将文本转化为图像的过程。校正流技术是一种新颖的方法，它可以加速和优化图像的生成过程。这种方法凭借其高效的性能，为文本到图像的快...

2023-06-06 talkingdev

近日，一项名为ViCo的新技术问世，其可以根据文本描述生成逼真的图像，并且能够从仅有的几个样本中捕捉到新概念的细节。与其他方法不同，ViCo对系统资源的消耗较小，不需要对原始模型的参数进行微调，但它仍然通过专...