漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-20 talkingdev

CaC开源-将3D物体放置在图像生成中

Compose and Conquer公司推出了一种条件扩散模型,该模型在生成的图像中的三维空间中放置物体方面表现出色。该模型可用于生成逼真的图像,例如虚拟世界中的景观和人物。条件扩散模型的优点在于其可以对图像进行分层...

Read More
2024-01-20 talkingdev

Vlogger开源,AI系统提供分钟级别的短视频制作

近日,AI系统Vlogger在GitHub上推出了自己的仓库,为用户提供分钟级别的视频博客制作服务。Vlogger的制作流程分为四个阶段:脚本、演员、节目制作和配音,每个阶段都代表着视频制作的不同方面。用户只需要向Vlogger...

Read More
2024-01-20 talkingdev

论文:自然语言控制图像编辑技术大幅提升

一项新的研究通过解决图像编辑中存在的挑战,例如不明确的指令和识别需要修改的图像部分,大幅提高了使用自然语言指令编辑图像的效率。该研究使用了深度学习和自然语言处理技术,将自然语言指令转换为可执行的图像编...

Read More
2024-01-20 talkingdev

苹果发布大型图像模型预训练论文

苹果公司发布了一篇关于用自回归损失预训练图像模型的论文。它测量了扩展行为,并发现像语言一样,这些大规模无监督的图像模型具有非常可预测的行为。这项技术为图像识别和计算机视觉领域的研究提供了新的思路和方法...

Read More
2024-01-20 talkingdev

论文:向量检索基础知识

该份文档详细介绍了向量检索领域的最新状态,涵盖了所需的各个方面知识点。由于其价值,需要花费一定时间来深入研读。向量检索是一种新型的信息检索技术,它是计算机科学和信息检索领域的前沿技术之一,已经成为各种...

Read More
2024-01-20 talkingdev

马克·扎克伯格的新目标是创建AGI

Meta的CEO马克·扎克伯格正在进入开发人工通用智能(AGI)的竞争,旨在增强Meta的应用程序和用户体验。他强调了AI人才和计算能力的需求,并考虑采用开源方法进行AI开发,与其他公司更封闭的方法形成对比。

Read More
2024-01-20 talkingdev

OpenAI宣布与亚利桑那州立大学合作,推出ChatGPT智能教育平台

OpenAI宣布与亚利桑那州立大学合作,该大学将获得完整的ChatGPT Enterprise访问权限,可用于课程、辅导、研究等,包括为学生打造个性化的AI导师和创意AI头像。

Read More
2024-01-17 talkingdev

Meta新技术,实现语音克隆和翻译无缝衔接

Meta最近展示了一项新的技术,可以实现语音克隆和翻译的无缝衔接。该技术使用深度学习和自然语言处理等技术,可以在不改变说话者声音和语调的情况下,将一种语言翻译成另一种语言。这种技术将为多语种交流和语言学习...

Read More
  1. Prev Page
  2. 326
  3. 327
  4. 328
  5. Next Page