漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-29 talkingdev

联合训练大型多模态模型:一种新的算法取得了突破

模型通常针对特定任务(例如,语言生成和图像生成)进行单独训练。然而,最近提出的一种名为联合自回归混合(JAM)的算法,通过巧妙地交叉注意力和温和的微调,成功地将不同的模型结合在一起。这种新颖的方法在多种...

Read More
2023-09-29 talkingdev

Meta的文字转图片模型超越SDXL,引领新AI助手之路

Meta公司新推出的Emu图像生成模型已在用户偏好调查中超越SDXL。Emu模型是在11亿图像对上进行预训练的,只在几千张精心策划的图像上进行了微调。此模型将作为Meta新AI助手计划的主要支柱。Emu的高效性能,证明了大规...

Read More
2023-09-28 talkingdev

UnitedHuman:高质量人像图像生成方式开源

本项目推出了一款名为UnitedHuman的新工具,它能够使用来自多个不同来源的图像,并将它们进行组合,即使这些图像的大小不同或者关注的焦点不同。UnitedHuman的强大之处在于,它能够克服这些差异,生成出高质量的人像...

Read More
2023-09-28 talkingdev

Meta Connect 2023:Quest 3 VR、Ray-Ban智能眼镜和Meta AI的一切

Meta的年度Connect大会已经开始,这意味着有很多新的硬件发布。本文总结了主题演讲中最重要的公告。这些公告涉及Meta Quest 3、Quest上的Xbox Cloud游戏、一种名为Emu的图像生成新基础模型、Ray-Ban Meta智能眼镜和M...

Read More
2023-09-27 talkingdev

Getty联手Nvidia推出商业化图像生成服务

由Nvidia赋能的Getty最近推出了一项商业图像生成服务,该服务提供了强大的商业保障。这一服务的推出,将进一步推动图像生成技术的商业应用,特别是在广告、媒体和娱乐等行业,提供更加贴近需求的图像内容。Getty与Nv...

Read More
2023-09-21 talkingdev

OpenAI发布DALL·E 3:理解力显著提升,即将融入ChatGPT

OpenAI最近发布了其最新的系统DALL·E 3,这一系统相比之前的版本在理解细微之处和细节方面表现得更加出色,使得用户能够更轻松地将自己的想法转化为极其精确的图像。这一系统很快就会原生集成到ChatGPT中。DALL·E 3...

Read More
2023-09-21 talkingdev

OpenAI最新AI图像生成器以细节和快速保真度推动极限

OpenAI的最新文本到图像生成器DALL-E 3将于10月初向ChatGPT Plus和企业客户提供。OpenAI尚未发布有关该模型的任何技术细节。DALL-E 3可以更有效地精细化处理,例如手部细节,并可以创建引人入胜的图像,无需任何hack...

Read More
2023-09-20 talkingdev

论文:将长篇文字转化为图像,提升文本到图像生成的新方法

将长篇文字转化为图像一直是一项艰巨的任务,尤其当需要展示的项目或细节众多时。然而,一种新的方法打破了这个困扰。这种新的方法将长篇描述分解成更简单的步骤,确保每个细节在图像中的位置都恰到好处,从而为从文...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page