漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-02 talkingdev

论文:Total-Decom引领3D场景编辑新突破

Total-Decom技术通过从多视角图像中准确分解物体,以最小的用户努力实现3D场景重建,为用户提供了简便的编辑和操控体验。这一技术的出现,标志着3D场景编辑领域的一大进步,使得非专业人士也能轻松进行3D场景的创作...

Read More
2024-03-28 talkingdev

文本和姿势条件助力AID与PAID技术提升图像生成质量

AID及其变体PAID是两种旨在通过加入文本和姿势等条件来改进图像插值的技术。这些方法确保生成的图像在不需要额外训练的情况下,具有更高的一致性、平滑度和真实性。图像生成技术的进步不仅推动了人工智能领域的创新...

Read More
2024-03-25 talkingdev

哈希网格辅助上下文框架实现3D高斯数据75倍压缩

本项目介绍了哈希网格辅助上下文(HAC)框架,该框架实现了3D高斯数据(3DGS)的压缩,压缩比超过75倍,超越了当前的压缩标准。通过采用这种创新技术,3D高斯数据的存储和传输效率将得到显著提升,对于云计算、游戏...

Read More
2024-03-25 talkingdev

OpenAI向好莱坞推介视频生成工具Sora

OpenAI正将其视频生成工具Sora推介给多家好莱坞制片厂、艺人经纪公司以及媒体高管。Sora是一款基于人工智能技术的视频制作软件,能够根据文本提示生成逼真的视频画面。这一工具的推广可能会对电影制作、广告创意以及...

Read More
2024-03-22 talkingdev

Meta Reality Labs推出场景脚本3D场景重建技术

Meta Reality Labs最新研发的模型能够将视觉输入转换为场景的三维表示。这个拥有7000万个参数的模型能够在设备上快速运行,并且展现出极高的稳定性。这一技术的发展,不仅为虚拟现实和增强现实领域带来了新的突破,...

Read More
2024-03-19 talkingdev

谷歌发布能让静态图片“活”起来的AI技术

谷歌的研究团队近日推出了一款名为VLOGGER的人工智能技术,该技术能够通过单张照片生成人物说话和活动的逼真视频。这一技术突破不仅在视觉效果上取得了显著进展,也为人机交互和虚拟现实领域带来了新的可能性。VLOGG...

Read More
2024-03-19 talkingdev

Stability AI发布Stable Video 3D,开创三维模型新纪元

Stability AI近日推出了基于Stable Video的新技术——Stable Video 3D。该技术能够通过单一图片生成3D模型,其性能超越了Stable Zero 123及其他现有方法。目前,Stable Video 3D的权重数据已经对外提供,旨在支持研究...

Read More
2024-03-19 talkingdev

苹果研究团队在多模态人工智能领域取得重大突破

苹果公司的研究团队近期在人工智能领域实现了创新性进展,他们开发出了一种能够在文本和图像上同时训练大型语言模型的方法。这一成就推动了多模态AI任务在性能上的显著提升,达到了艺术级水平。所谓多模态AI,指的是...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page