漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-25 talkingdev

探索程序:Prompts是软件工程的子集

Prompt工程只是软件工程的一部分。Prompt是用自然语言编写的小程序。通过巧妙地使用词汇来猜测正确的'函数调用',因为API未指定且在模型之间变化巨大,这是游戏的重要部分。将Prompt视为代码,允许Prompt工程师为喜...

Read More
2024-01-25 talkingdev

Lumiere-谷歌AI视频生成器能够将可爱的动物放入不同场景中

Lumiere是一款使用时空扩散模型进行逼真视频生成的AI视频生成器。它使用的Space-Time U-Net架构可以一次性生成整个视频的时间持续时间。它旨在处理视频中物体的位置以及物体如何移动和变化。Lumiere可以执行文本到视...

Read More
2024-01-24 talkingdev

微软CEO纳德拉希望OpenAI保持稳定,不为控制权

微软CEO Satya Nadella满意目前微软与OpenAI的合作状态,强调稳定性而非掌控权,这是在欧盟和英国进行监管审查期间的举措。他强调微软在独立AI开发方面的重要性以及他们对OpenAI的重要投资。

Read More
2024-01-24 talkingdev

Auto Wiki:利用AI将你的代码库转化为维基百科式文章

Auto Wiki是一款全新的工具,它可以将你的代码转化为易于阅读的维基百科式文章。它使用了人工智能技术,将代码中的注释和文档转化为自然语言,并生成易于理解的页面,以便团队成员更好地阅读和理解代码。Auto Wiki可...

Read More
2024-01-24 talkingdev

MM-Interleaved模型开源,可实现图文数据生成

近日,GitHub开源了MM-Interleaved模型,该模型在处理和生成交替的图文数据方面表现出色。MM-Interleaved模型能够根据输入的文本描述生成对应的图像,同时也可以从图像中提取文本。该模型使用了条件生成对抗网络(Co...

Read More
2024-01-24 talkingdev

交互式控制文本生成技术革新,多模态语言模型中引入“提示高亮器”

研究人员引入了“提示高亮器”方法,它革新了多模态语言模型中的文本生成技术,使用户能够突出提示的某些部分,从而更好地控制生成的文本。这种方法提供了一种更加灵活、直观和有效的交互式控制方式,使得文本生成的结...

Read More
2024-01-24 talkingdev

我的AI时间表再次加速

本文作者根据模型扩展的进展修改了其人工智能时间表预测。他们现在估计,到2028年有10%的机会实现人工智能通用智能,并且到2045年有50%的机会。这些变化归因于大型语言模型的有效性以及多个智能能力可能会在规模上出...

Read More
2024-01-24 talkingdev

DepthAnything:通过大规模数据集提高单目深度估计精度

Depth Anything是一种新的单目深度估计方法,它依赖于约6200万张图像的大规模数据集来提高其精度。通过使用数据增强和预训练编码器的辅助监督,该模型实现了令人印象深刻的泛化能力,并在深度估计方面树立了新的标准...

Read More
  1. Prev Page
  2. 316
  3. 317
  4. 318
  5. Next Page