漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-31 talkingdev

Threestudio:将2D转3D的统一框架

今天,我们向大家介绍一个名为Threestudio的开源项目。这个项目采用了先进的2D文本到图像生成模型,从文本提示、单张图像和少量样本图像中创建3D内容的统一框架。 以下是该框架的三个核心要点: - Threestudio利用...

Read More
2023-05-31 talkingdev

Github项目ProlificDreamer提升文本到3D图像生成效果

ProlificDreamer是一种提高文本到3D图像生成效果的新方法。它通过将3D参数视为随机变量来解决文本到3D生成中早期Score Distillation Sampling(SDS)方法中存在的过度饱和和低多样性等问题。这种变分Score Distillat...

Read More
2023-05-19 talkingdev

FastComposer:高效个性化的多主题文本到图像生成技术

近日,研究人员开发出一种名为FastComposer的新方法,能够快速创建个性化的多主题图像,避免了其他方法中耗时的微调。不仅如此,FastComposer还能够处理多主题生成中的混合问题,并且可以更快地生成不同风格、动作和...

Read More
2023-05-10 talkingdev

新技术提升图像生成模型能力:SUR-adapter

近日,科研团队推出了一种名为 SUR-adapter 的新技术,可升级计算机程序中的扩散模型,将简单的描述转化为详细的图像。通过训练这些模型更好地理解故事,并使用超过 57,000 个样本的新数据集,研究人员使模型更擅长...

Read More
2023-05-05 talkingdev

利用字体颜色控制图像生成技术的研究

研究人员调查了在富文本中发现的各种格式元素(例如字体大小、颜色、样式和脚注)的使用,以生成从文本到图像的过程。他们的方法允许轻松控制本地样式、准确地创建颜色,并在处理长文本提示时提供额外信息。通过利用...

Read More
2023-05-04 talkingdev

开放数据集“Pick-a-Pic”用于生成文本到图像的用户偏好研究

一个名为“Pick-a-Pic”的网络应用程序被创建,让人们生成图像并分享他们的喜好,从而形成了一个大型的开放数据集,用于训练一个智能评分系统PickScore。PickScore非常擅长预测人们的喜好,并且在评估文本到图像模型方...

Read More
2023-04-28 talkingdev

多视角图像生成中的照片级真实感

新闻内容: - 该研究专注于用于3D相关应用程序(如图像视点编辑)的多视角图像生成。 - 提出的射线调节方法使用几何无关方法生成多视角图像,通过将2D GAN与光场先验相结合,提供了更好的照片级真实感、身份一致性...

Read More
2023-04-27 talkingdev

HDR-NeRF:高动态范围神经辐射场

新闻内容: - HDR-NeRF是一种新型的图像生成技术,可以生成高质量的高动态范围图像。 - 这项技术是通过将神经网络与辐射场建模相结合来实现的,可以在各种光照条件下生成细节丰富的图像。 - HDR-NeRF技术可能被用于...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page