漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-02 talkingdev

MagicPost:利用人工智能打造更好的求职帖子

MagicPost是一款基于人工智能的应用程序,旨在帮助LinkedIn用户创造更好的帖子。 MagicPost使用AI分析已发布的帖子,评估其受欢迎程度,并提供建议和编辑,以改进未来的帖子。该应用程序可以为用户节省时间和精力,...

Read More
2023-11-01 talkingdev

COMM开源,改进多模态LLMs性能

近期,研究人员深入探究了多模态大型语言模型(MLLMs)中使用的视觉编码器,并发现CLIP和DINO模型中的某些特征特别适合于详细的视觉任务。他们随后引入了COMM,一种结合了两种模型优点的策略。COMM能够显著提高LLMs...

Read More
2023-11-01 talkingdev

同构实验室预告AlphaFold的下一版本

AlphaFold是科学领域中的一项惊人模型。新的工作是由同构实验室(Google的一个衍生公司)进行的,不仅将其应用领域扩展到蛋白质以外,还提高了整体性能。AlphaFold的改进和发展,将有力推动科学研究的深入,对生物医...

Read More
2023-10-25 talkingdev

噪声调度改进了视频扩散技术

单个提示生成单个图像通常很好,但在生成视频时由于帧之间的时间变化而失败。 然而,更改文本时的一致性非常具有挑战性。 这项工作解决了这两个问题,并利用扩散技术实现了长达512帧的生成。

Read More
2023-10-25 talkingdev

cola,利用视觉语言模型增强视觉推理

Cola是一个使用大型语言模型来协调各种视觉语言模型(VLM)以改进视觉推理的系统。该代码库已经在GitHub上发布。

Read More
2023-10-25 talkingdev

OpenAI计划推出重大更新,吸引开发者降低成本

OpenAI计划推出重大更新,以帮助开发者更加经济快速地创建基于人工智能的应用。这些更新包括增加内存存储和新的视觉能力,这些能力将大大降低开发成本。这些改进预计将在OpenAI首次开发者大会上宣布。

Read More
2023-10-24 talkingdev

推出基础模型透明度指数

斯坦福、麻省理工和普林斯顿的一组研究人员开发了一个透明度指数,用于评估商业基础模型的透明度水平。这个指数被称为基础模型透明度指数(FMTI),评估了透明度的100个不同方面,结果表明,在主要的基础模型公司中...

Read More
2023-10-23 talkingdev

upsampling开源库实现图像生成模型数据质量提升

DALLE-3图像生成模型的质量提升的主要驱动力之一是改进后的数据质量。通过使用内部模型进行标题上采样来实现。这里提供了一个使用强大的开源模型进行实现的GitHub开源库。

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page