漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-10-14 talkingdev

论文:DeepSeek通过大规模合成数据推动LLM中的定理证明进展

DeepSeek项目致力于通过大规模合成数据提升LLM在定理证明领域的能力。传统的定理证明通常依赖于有限的标注数据,这限制了模型的学习和推理能力。DeepSeek通过生成多样化的合成数据集,训练模型识别和解决复杂的数学...

Read More
2024-10-13 talkingdev

diffusion扩散技术助力世界建模新纪元

扩散技术在世界建模领域的应用正在引起广泛关注。通过使用先进的LLM和agent模型,研究人员能够生成更为精准和高效的世界模型。这种技术不仅提升了数据处理的速度,还增强了模型在复杂环境中的表现能力。特别是在嵌入...

Read More
2024-06-27 talkingdev

论文:利用检索增强指令调整进行命名实体识别

检索增强指令调整(RA-IT)通过大型语言模型对信息进行提取,从而提高了信息提取的效率。这种技术的出现,为我们理解和处理大量信息提供了新的可能。RA-IT不仅可以提高信息提取的速度,还可以提高提取信息的准确性,...

Read More
2024-06-26 talkingdev

AI与Morph Labs联手优化信息检索增强型生成模型

近日,AI与Morph Labs联合发布了一篇关于信息检索增强型生成(RAG)模型微调的优秀博客文章。在文章中,他们展示了一些合成数据的使用情况。信息检索增强型生成模型是一种新型的深度学习模型,它结合了信息检索技术...

Read More
2024-05-02 talkingdev

RAGs检索增强语言模型完全指南

本次调查报告深入探讨了检索增强语言模型(RALMs)的领域,重点展示了它们的演变过程、结构以及在NLP任务中的多样化应用,如翻译和对话系统。检索增强语言模型是一种新型的语言模型,不仅通过训练数据生成文本,还能...

Read More
2024-04-12 talkingdev

Cohere推出Rerank 3模型,助力企业搜索与RAG升级

Cohere公司近日发布了其最新的基础模型——Rerank 3,专为提升企业搜索和检索增强生成(RAG)系统而设计。该模型兼容任何数据库或搜索索引,并且可以轻松插入到任何具有原生搜索功能的旧版应用程序中。仅需一行代码,R...

Read More
2024-04-08 talkingdev

Cohere发布Command R+:面向企业的可扩展大型语言模型

Cohere公司近日推出了Command R+,这是一款专为企业级应用场景设计的高性能、可扩展的大型语言模型(LLM)。Command R+具备先进的检索增强生成功能,并支持引用,同时覆盖10种关键语言的多语言处理能力,以及工具使...

Read More
2024-02-26 talkingdev

Marqo融资1250万美元,帮助企业构建生成式AI应用

向量搜索公司Marqo在由Lightspeed领导的A轮融资中筹集了1250万美元,以推进其下一代向量搜索平台的采用。Marqo的平台解锁了非结构化数据的巨大价值,覆盖了包括最终用户搜索、检索增强生成等关键企业应用,帮助企业...

Read More
2024-02-13 talkingdev

Llmware:统一LLM应用程序开发框架

Llmware是一个统一的框架,用于开发基于LLM的应用程序模式,包括检索增强生成。它提供了一个通用的API,使得开发人员能够轻松地使用不同的LLM模型和数据集。Llmware还为开发人员提供了一组可自定义的工具,用于自动...

Read More
2023-11-10 talkingdev

Cohere发布业内领先的嵌入模型

Cohere的最新模型是用于与真实世界的嘈杂数据互动的搜索应用的升级,以及用于检索增强生成(RAG)系统的应用。其多语言模型现在支持100多种语言,并可用于搜索同一语言内的内容(例如,在法国文档上使用法语查询进行...

Read More
  1. Next Page