检索的相关内容 - 漫话开发者

2024-04-01 talkingdev

xAI发布新一代模型Grok 1.5，提升编程与检索能力

人工智能公司xAI近日宣布推出其最新模型Grok 1.5，该模型具有128k的上下文长度，能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升，尤其在信息检索和编程领域表现出色。这使得开发者和...

2024-03-28 talkingdev

在RAG（检索-生成）管道中，对嵌入向量进行搜索是至关重要的一环。通过将fp32数字替换为单个0或1，并使用KNN聚类器和重排序器，可以在缩小内存需求30倍的同时，保持性能不受影响。这一技术突破为处理大规模数据集提...

2024-03-27 talkingdev

近期，UFineBench成为了文本人物检索领域的新基准。该技术利用详细描述来辅助人工智能更准确地理解和识别图像中的人物。UFineBench的出现标志着人工智能在图像识别领域的又一次重大进步，它不仅提高了识别的准确性，...

2024-03-22 talkingdev

Cohere近日推出了专为大规模生产而优化的RAG（Retrieval-Augmented Generation）模型Command-R，并宣布将该模型引入NVIDIA新推出的API目录。Command-R模型结合了检索与生成技术，能够助力企业快速进入大规模生产环境...

2024-03-19 talkingdev

下一个标记预测作为一个简单的目标，却能引发复杂的行为模式。最新的研究发现，仅通过一个自注意力层并结合梯度下降法训练，就能将问题分解为困难的检索和柔和的组合，这一过程不仅实现了上下文学习，还显著提升了模...

2024-03-15 talkingdev

文档重新排序对于检索来说非常关键，但在实践中却很难做到。最近在GitHub上发布了一个新的工具，可以提供文档重新排序的功能。这个工具可以很容易地集成到你的检索流程中。

2024-03-12 talkingdev

互联网档案馆拥有超过2亿个OCR图书页面，可供研究使用。该数据集可用于文本识别、自然语言处理、信息检索等多个领域的研究。研究人员可以使用该数据集进行模型训练、语言建模、数据分析等工作。该数据集的发布将加速...

2024-03-04 talkingdev

这个仓库包含了一系列有用的资源，重点是大型语言模型在视频理解领域的应用。这些资源包括论文、代码和数据集，可以帮助研究人员和工程师更好地理解和应用LLMa模型。LLMa模型是一种基于自然语言处理的技术，在视觉和...