漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-11 talkingdev

多视角图像生成技术 ViewFusion

近日,研究人员提出了一种名为 ViewFusion 的新算法,旨在改善扩散模型从新的视角生成图像的方式,确保图像在不同视角下保持一致。传统的扩散模型在处理多视角图像时,往往会产生不一致性,导致图像质量下降。ViewFu...

Read More
2024-03-05 talkingdev

谷歌联合创始人谢尔盖·布林在罕见的公开露面中表示公司“绝对搞砸了”Gemini图像发布

Alphabet联合创始人谢尔盖·布林退休后回归工作,专注于人工智能,上周末在加利福尼亚州希尔斯伯勒的“AGI之家”与一群人工智能爱好者交流,谈到了人工智能对搜索的影响以及谷歌如何在人工智能不断发展的情况下保持领先...

Read More
2024-02-28 talkingdev

Meta或将在2024年晚些时候展示一款真正的AR智能眼镜

据悉,Meta可能会在今年晚些时候的Meta Connect活动上展示一款增强现实智能眼镜。该设备名为Orion,是一款真正的AR设备。公司内部存在很大压力来制作高质量的演示。公司内部人员现在正在尝试使用先进的原型机进行实...

Read More
2024-02-16 talkingdev

Google发布Lumiere文本到视频模型

Google最近推出了一种新的文本到视频模型Lumiere,该模型可以将图像和风格作为输入,并使用一种新颖的“空时UNet”同时扩散所有内容。该模型采用了深度学习技术,可以将文本内容转换为相对应的视频,并且不需要任何人...

Read More
2024-01-31 talkingdev

Apple Vision Pro评测:神奇,直到失灵

Apple Vision Pro在市场营销中展示了人们随时使用该设备的场景:工作时、洗衣服时甚至和孩子玩耍时都能使用。该设备旨在将应用程序和信息叠加在现实世界中,增强现实。虽然该设备有时令人惊叹,但它也存在一系列不可...

Read More
2024-01-26 talkingdev

ViroReact:构建增强现实和虚拟现实体验的库

ViroReact是一款用于构建增强现实和虚拟现实体验的库。它可以原生地在所有移动VR和AR平台上运行React Native代码。该库提供了一个展示示例项目的页面,让开发者可以快速上手。此外,ViroReact还提供了丰富的开发文档...

Read More
2024-01-22 talkingdev

Meta发布音乐和声音生成模型(HuggingFace Hub)

Meta最近推出了一系列令人难以置信的音乐和声音生成模型,并发布了推理代码。这些模型是通过机器学习训练的,可以生成高质量的音乐和声音效果。该公司表示,这些模型可以用于广泛的应用场景,包括游戏声音、虚拟现实...

Read More
2024-01-12 talkingdev

苹果Vision Pro 上市量传闻中比之前的预测要紧缩得多

著名的苹果分析师郭明錤认为,在苹果视觉 Pro 上市当天,苹果公司将有 6 万到 8 万个 Apple Vision Pro 设备可用。这个数字比之前的预测要紧缩得多,这意味着苹果可能会面临供应短缺的问题。苹果视觉 Pro 是一款专业...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page