UNet的相关内容 - 漫话开发者

2024-02-16 talkingdev

Google发布Lumiere文本到视频模型

Google最近推出了一种新的文本到视频模型Lumiere，该模型可以将图像和风格作为输入，并使用一种新颖的“空时UNet”同时扩散所有内容。该模型采用了深度学习技术，可以将文本内容转换为相对应的视频，并且不需要任何人...

2023-12-20 talkingdev

最近的一项研究表明，与解码器相比，使用UNet编码器在扩散模型中表现更加稳定。这一发现导致了一种新的编码器传播方案，显著加快了文本到图像和文本到视频生成等任务的速度。该研究成果已在GitHub上发布。

2023-11-09 talkingdev

PixArt是一种新的文本到图像模型，它使用T5文本编码、交叉注意力和扩散变压器，以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型，可以比使用UNet模型训练快90%。PixArt模型的训练...

2023-09-22 talkingdev

稳定扩散是一种复杂的技术，其可大幅度提高生成质量，而无需进行额外的训练。这是通过巧妙地调整权重和在UNet中扩大残差来实现的。具体的代码将在不久后公布。UNet是一种广泛应用于图像分割的深度学习框架，其独特的...

2023-08-31 talkingdev

医疗图像分割是一个将图像中每个像素识别为特定类别（如癌症与非癌症）的过程。在历史上，将一个模型转移到另一个任务一直是个巨大的挑战。然而，最新的研究展示了一个强大的模型，该模型仍基于不朽的UNet，可应用于...