漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-14 talkingdev

instaflow-利用流校正技术实现文本到图像生成的超速进程

研究人员已经找到一种方法,通过使用名为校正流(Rectified Flow)的技术,加快将文本转化为图像的过程。校正流技术是一种新颖的方法,它可以加速和优化图像的生成过程。这种方法凭借其高效的性能,为文本到图像的快...

Read More
2023-06-06 talkingdev

ViCo:使用扩散模型的轻量级文本到图像生成技术

近日,一项名为ViCo的新技术问世,其可以根据文本描述生成逼真的图像,并且能够从仅有的几个样本中捕捉到新概念的细节。与其他方法不同,ViCo对系统资源的消耗较小,不需要对原始模型的参数进行微调,但它仍然通过专...

Read More
2023-06-05 talkingdev

StyleDrop:利用单个参考图像在任何风格下实现文本到图像生成

在人工智能领域中,研究人员一直在探索如何利用计算机生成逼真的图像。在这个过程中,DreamBooth 系列研究的下一个步骤——StyleDrop 已经发布。这个开源项目提供了一种新的方法,只需要使用单个参考图像,就可以在任...

Read More
2023-05-31 talkingdev

Threestudio:将2D转3D的统一框架

今天,我们向大家介绍一个名为Threestudio的开源项目。这个项目采用了先进的2D文本到图像生成模型,从文本提示、单张图像和少量样本图像中创建3D内容的统一框架。 以下是该框架的三个核心要点: - Threestudio利用...

Read More
2023-05-19 talkingdev

FastComposer:高效个性化的多主题文本到图像生成技术

近日,研究人员开发出一种名为FastComposer的新方法,能够快速创建个性化的多主题图像,避免了其他方法中耗时的微调。不仅如此,FastComposer还能够处理多主题生成中的混合问题,并且可以更快地生成不同风格、动作和...

Read More
2023-05-04 talkingdev

开放数据集“Pick-a-Pic”用于生成文本到图像的用户偏好研究

一个名为“Pick-a-Pic”的网络应用程序被创建,让人们生成图像并分享他们的喜好,从而形成了一个大型的开放数据集,用于训练一个智能评分系统PickScore。PickScore非常擅长预测人们的喜好,并且在评估文本到图像模型方...

Read More
  1. Prev Page