漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-01 talkingdev

论文:Seismic使用更快的嵌入搜索进行文本检索

Seismic是一种创新的组织倒排索引的方法,它通过学习稀疏嵌入大大提高了文本检索的速度和准确性。倒排索引是一种常用的信息检索技术,其基本原理是通过构建单词到文档的映射,从而快速找到包含特定单词的文档。而Sei...

Read More
2024-04-30 talkingdev

Memary开源:长记忆Agent开启大规模知识图谱存储新篇章

近日,GitHub上出现了一个名为Memary的新项目。该项目允许Agent在知识图谱中存储大量信息,通过我们的记忆模块推断用户知识,只检索与结果相关的信息。Memary的核心是其强大的知识图谱,这是一种可以存储和组织大量...

Read More
2024-04-01 talkingdev

xAI发布新一代模型Grok 1.5,提升编程与检索能力

人工智能公司xAI近日宣布推出其最新模型Grok 1.5,该模型具有128k的上下文长度,能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升,尤其在信息检索和编程领域表现出色。这使得开发者和...

Read More
2024-03-12 talkingdev

互联网档案馆图书数据集开放

互联网档案馆拥有超过2亿个OCR图书页面,可供研究使用。该数据集可用于文本识别、自然语言处理、信息检索等多个领域的研究。研究人员可以使用该数据集进行模型训练、语言建模、数据分析等工作。该数据集的发布将加速...

Read More
2024-02-29 talkingdev

论文:ListT5重排方法以提高信息检索的准确性

ListT5推出了一种前沿的重排方法,不仅可以提高信息检索的准确性,还提供了一个高效的解决方案,以应对以前的列表式重排器面临的挑战。

Read More
2024-01-30 talkingdev

RAG:探索ColBERT和RAGatouille

ColBERT是一个出色的模型,用于为RAG应用嵌入查询和索引数据。本文探讨了该方法背后的直觉,并进行了一些基准测试。ColBERT的特点在于,它将查询和文档嵌入到一个共享空间中,从而可以直接在该空间中进行相似性匹配...

Read More
2024-01-20 talkingdev

论文:向量检索基础知识

该份文档详细介绍了向量检索领域的最新状态,涵盖了所需的各个方面知识点。由于其价值,需要花费一定时间来深入研读。向量检索是一种新型的信息检索技术,它是计算机科学和信息检索领域的前沿技术之一,已经成为各种...

Read More
2023-09-21 talkingdev

检索不仅仅是嵌入式搜索:AI检索技术的改进与挑战

语言模型在处理实际查询时,经常出现虚构的细节。通过检索事实,我们可以减少这些不准确性。然而,将查询嵌入并对向量存储进行搜索的检索增强生成(RAG)的基础形式往往表现不佳。本文讨论了如何利用查询对象和信息...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page