漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

深度学习模型 DeepFloyd IF 是一种模块化的模型,旨在根据文本提示生成高质量的图像。该基础模型可以创建 64x64 像素的图像,而两个超分辨率模型可以创建 256x256 像素和 1024x1024 像素版本的图像。在 COCO 数据集上,DeepFloyd IF 的零样本 FID 得分为 6.66,优于当前最先进的模型。DeepFloyd IF 生成的图像示例可在存储库中找到。 核心要点: - DeepFloyd IF 是一种模块化的深度学习模型,可生成高质量的图像。 - 该模型可以创建不同分辨率的图像,包括 64x64、256x256 和 1024x1024 像素版本。 - 在 COCO 数据集上,DeepFloyd IF 的零样本 FID 得分为 6.66,表现优异。