改进的相关内容 - 漫话开发者

2023-11-02 talkingdev

MagicPost：利用人工智能打造更好的求职帖子

MagicPost是一款基于人工智能的应用程序，旨在帮助LinkedIn用户创造更好的帖子。 MagicPost使用AI分析已发布的帖子，评估其受欢迎程度，并提供建议和编辑，以改进未来的帖子。该应用程序可以为用户节省时间和精力，...

2023-11-01 talkingdev

近期，研究人员深入探究了多模态大型语言模型（MLLMs）中使用的视觉编码器，并发现CLIP和DINO模型中的某些特征特别适合于详细的视觉任务。他们随后引入了COMM，一种结合了两种模型优点的策略。COMM能够显著提高LLMs...

2023-11-01 talkingdev

AlphaFold是科学领域中的一项惊人模型。新的工作是由同构实验室（Google的一个衍生公司）进行的，不仅将其应用领域扩展到蛋白质以外，还提高了整体性能。AlphaFold的改进和发展，将有力推动科学研究的深入，对生物医...

2023-10-25 talkingdev

单个提示生成单个图像通常很好，但在生成视频时由于帧之间的时间变化而失败。然而，更改文本时的一致性非常具有挑战性。这项工作解决了这两个问题，并利用扩散技术实现了长达512帧的生成。

2023-10-25 talkingdev

Cola是一个使用大型语言模型来协调各种视觉语言模型（VLM）以改进视觉推理的系统。该代码库已经在GitHub上发布。

2023-10-25 talkingdev

OpenAI计划推出重大更新，以帮助开发者更加经济快速地创建基于人工智能的应用。这些更新包括增加内存存储和新的视觉能力，这些能力将大大降低开发成本。这些改进预计将在OpenAI首次开发者大会上宣布。

2023-10-24 talkingdev

斯坦福、麻省理工和普林斯顿的一组研究人员开发了一个透明度指数，用于评估商业基础模型的透明度水平。这个指数被称为基础模型透明度指数（FMTI），评估了透明度的100个不同方面，结果表明，在主要的基础模型公司中...

2023-10-23 talkingdev

DALLE-3图像生成模型的质量提升的主要驱动力之一是改进后的数据质量。通过使用内部模型进行标题上采样来实现。这里提供了一个使用强大的开源模型进行实现的GitHub开源库。