漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-26 talkingdev

论文:Adobe Research推出结构化文档检索工具,解决PDF文档检索难题

Adobe Research推出了一款工具,可以通过结构或文本条件来检索结构化文本文档,这项技术在文档为PDF格式时变得更加困难。此外,Adobe Research还发布了一个基准数据集供进一步研究使用。

Read More
2023-10-17 talkingdev

Ex-MCR:无配对数据的多模态学习方法

这项研究介绍了一种名为Ex-MCR的新方法,该方法可以有效地学习多个模态的统一对比表示,而无需配对数据。通过对齐现有的多模态对比表示,Ex-MCR在音频-视频检索和3D物体分类等任务中实现了最佳性能。该方法在GitHub...

Read More
2023-10-17 talkingdev

MemGPT:永久记忆聊天机器人开源

MemGPT允许开发者创建带有自我编辑记忆的永久聊天机器人。它智能地管理LLMs中的不同记忆层,以有效地提供扩展上下文。MemGPT知道何时将关键信息购买到向量数据库中,以及何时在聊天中检索它,从而实现永久对话。该存...

Read More
2023-09-25 talkingdev

提升嵌入式查询速度的智能技巧(Jupyter Notebook)

检索是一种提高生成质量的方法。然而,嵌入查询和搜索往往较慢。本笔记本展示了一些巧妙的技巧,可以帮助提高检索性能。检索过程中的问题主要集中在嵌入查询和搜索上,这个过程往往效率低下。为了解决这个问题,我们...

Read More
2023-09-21 talkingdev

检索不仅仅是嵌入式搜索:AI检索技术的改进与挑战

语言模型在处理实际查询时,经常出现虚构的细节。通过检索事实,我们可以减少这些不准确性。然而,将查询嵌入并对向量存储进行搜索的检索增强生成(RAG)的基础形式往往表现不佳。本文讨论了如何利用查询对象和信息...

Read More
2023-09-20 talkingdev

论文:DoLa一种让大型语言模型更加精准的方法

研究人员近日推出了一种名为DoLa的新方法,该方法能够帮助大型语言模型(例如与您进行聊天或撰写文章的模型)停止编造内容,而专注于事实。DoLa采用一种智能的方式比较模型内部的不同层次,以过滤出错误的信息。这是...

Read More
2023-09-20 talkingdev

Google的Bard聊天机器人现在可以扫描Gmail、Docs和Drive以检索信息和执行任务

Google的Bard聊天机器人现在可以通过扫描Gmail、Docs和Drive来检索信息和执行任务。Google表示,这些新的集成,被称作扩展,旨在节省用户在文档和邮件中寻找特定信息的时间。这一新的功能将大大提高用户的工作效率和...

Read More
2023-09-13 talkingdev

行星级规模的检索增强生成技术

Arcus公司通过使用分层检索器将检索增强生成(RAG)技术扩展到行星级规模。这种技术是通过将文件基于其语义内容进行分组聚类,然后逐步过滤这些组来缩小搜索空间。这样可以检索到更相关的上下文,减少幻觉,并在行星...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page