漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-04 talkingdev

多视角扩散的3D生成技术:全局一致性与语义连贯性的新突破

近期,3D生成方法的研究领域又有新进展。这次的新方法,生成出的网格模型在全局上具有一致性,并且在语义上呈现出连贯性。更令人兴奋的是,这项技术还有极大的加速优化空间。通过采用多视角扩散的方法,3D模型生成技...

Read More
2023-08-04 talkingdev

着色模型Color-Diffusion开源:给黑白图片注入色彩

近日,GitHub在其官方仓库中发布了一款名为Color-Diffusion的全新着色模型,该模型的主要功能是给黑白图片进行着色。Color-Diffusion模型采用了先进的扩散技术,可以将色彩自然地分布到黑白图片的每个像素点上,实现...

Read More
2023-07-25 talkingdev

Subject-Diffusion: 提升个性化图像生成的新突破(GitHub仓库)

该存储库介绍了主题扩散,这是开放领域个性化图像生成的一项突破性技术。它只需要一个参考图像,而且在测试时不需要进行微调。主题扩散技术的出现,将大幅提升图像生成的效率和准确性,且广泛应用于各类图像生成项目...

Read More
2023-07-03 talkingdev

多视角扩散技术提供全景图像生成能力

这项工作允许您使用一张单一的图像和一个预训练的生成模型来生成全景图像或图像的多个视角。

Read More
2023-06-07 talkingdev

Redditor运用稳定扩散技术制作出可读取的动漫风二维码

一位Reddit用户最近发布了一系列采用稳定扩散技术制作的艺术二维码,其风格为动漫和亚洲艺术风格,可通过智能手机相机应用程序进行扫描。该用户显然训练了多个定制的稳定扩散控制网络模型,并在将QR码输入图像生成器...

Read More
2023-04-18 talkingdev

Soundini:自然视频编辑的声音引导扩散技术

## 新闻内容: - 提出一种新方法,使用零样本声音引导视觉效果进行视频编辑,利用时间声音特征创建动态样式,同时保持时间一致性。 - 通过使用光流引导,引导去噪扩散概率模型与音频潜在表示相结合,该方法优于现有...

Read More
  1. Prev Page