漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-04 talkingdev

论文:改进稳定性的单幅图像超分辨率技术

研究人员开发了一种新的方法,通过关注两个关键方面来提高单幅图像超分辨率:潜在高分辨率图像的最佳质心和影响图像质量的固有噪声。其方法还使用了一个新的深度学习框架,该框架可以显著提高超分辨率的稳定性,避免...

Read More
2023-11-30 talkingdev

论文:通过扩散模型实现先进的视频超分辨率技术

StableVSR是一种新颖的视频超分辨率(VSR)方法,利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比,StableVSR可以更好地处理不同的噪声和失真情况,并且在不需要额外训练数据的情况下也...

Read More
2023-11-14 talkingdev

开源的音频超分辨率技术

音频超分辨率是提高任何音频的质量和保真度的过程,无论是真实的还是合成的。大多数超分辨率系统都是针对特定任务而设计的,单个模型仅针对单个音频数据类型进行训练(如语音与音乐)。这项新工作是一个惊人的进步,...

Read More
2023-08-09 talkingdev

新型图像增强方式:双聚合变换器(DAT)开源

研究人员已经开发出一种新的方法,叫做双聚合变换器(DAT),该方法通过空间和通道注意力来提升图像的超分辨率效果。DAT使用了诸如自适应交互模块和空间门前馈网络等特殊工具,其性能优于当前的其他方法。空间和通道...

Read More
2023-04-27 talkingdev

深度学习模型 DeepFloyd IF 能够根据文本提示生成高质量图片

深度学习模型 DeepFloyd IF 是一种模块化的模型,旨在根据文本提示生成高质量的图像。该基础模型可以创建 64x64 像素的图像,而两个超分辨率模型可以创建 256x256 像素和 1024x1024 像素版本的图像。在 COCO 数据集...

Read More
2023-04-27 talkingdev

DeepFloyd IF代码发布

- Stability AI发布了下一代图像模型代码 - 模型是一个多阶段模型,具有冻结的T5文本编码器和两个超分辨率模型 - 模型能够呈现极高质量的文本,可能首先只面向研究,但会在社区反馈后开放。 深度学习模型 DeepFloyd...

Read More
  1. Prev Page