漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-27 talkingdev

Director3D开源-现实世界3D场景AI生成框架

近日,一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器(Trajectory Diffusion Transformer)和多视图...

Read More
2024-05-16 talkingdev

IC-Relight:开源AI重照明工具,图像光照效果大幅提升

GitHub上最新的AI项目IC-Relight,是一款使用前景分离和文本调节的AI重照明工具,能带来极其强大的结果。该工具利用AI技术,将图像分为前景和背景,然后通过文本调节,实现对图像的精细控制和调整。这种方法的应用,...

Read More
2024-04-04 talkingdev

Stability AI推出Stable Audio 2.0音乐生成模型

Stability AI近日宣布了其音乐生成模型的下一代产品——Stable Audio 2.0。该模型通过合法授权的音乐数据进行训练,能够生成长达3分钟的高质量音乐作品。Stable Audio 2.0还具备音频到音频的生成技术,这意味着用户可...

Read More
2024-02-14 talkingdev

Deepfake结合NeRFs和GS技术制作高度逼真的3D头像

近日,一篇名为《ImplicitDeepfake1》的论文在计算机图形学领域引起了广泛关注。该论文提出了一种新方法,将deepfake技术与Neural Radiance Fields(NeRFs)和Gaussian Splatting(GS)相结合,用于创建高度逼真的3D...

Read More
2023-12-11 talkingdev

Kandinsky3.0:升级版文本转图像技术,实现更高质量、真实感的图像生成

Kandinsky 3.0是一种文本转图像模型,它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络(GAN)模型,通过学习图像语义和语法,从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...

Read More
2023-08-24 talkingdev

科学家发现新的文本到3D模型转换技术

科学家们已经找到了一种新的将文本转换为3D模型的方法,这种方法运用了特殊的技术,但有时结果并不完美。IT3D引入了一种智能策略,该策略使用多个视点和一个特殊的训练系统,使得3D创作看起来更加真实。这种技术的应...

Read More