漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-19 talkingdev

Mistral与Nvidia全新多语言模型Nemo 12B震撼发布

Mistral公司与Nvidia携手研发的全新多语言模型Nemo 12B已经正式发布。这款模型采用了全新的分词器进行训练,展现出了强大的多语言和英语处理能力。值得一提的是,Nemo 12B还支持128k的上下文。这种强大的性能,无疑...

Read More
2024-06-07 talkingdev

阿里云发布旗舰语言模型Qwen 2,效果超闭环模型

阿里云最新发布的旗舰语言模型Qwen 2在基准性能测试中略超越了Llama 3 70B,成为新一代语言模型的标杆。Qwen 2不仅在英语性能方面表现卓越,同时也是一个更优秀的多语言模型。这一突破性进展标志着阿里云在人工智能...

Read More
2024-05-24 talkingdev

Cohere推出多语言Aya模型

Cohere最新发布的Aya项目包含3种不同规模的模型,能够使用101种语言进行对话,其中许多语言资源极为稀缺。Aya项目的推出对于开放和普及研究社区来说是一个巨大的进步。通过这一项目,研究人员和开发者能够更广泛地获...

Read More
2024-03-12 talkingdev

Cohere For AI发布Command-R多语言模型

Cohere For AI发布了一个30B+参数模型,该模型在10种语言的推理、摘要和问答方面非常擅长。该模型名为Command-R,是自然语言处理领域的一项重大突破。Command-R模型可以在多语言环境下进行推理和答案提取,这对于跨...

Read More
2024-02-21 talkingdev

论文:零数据训练,成功突破语音翻译难题

近日,一项名为ZeroSwot的新方法被提出,通过独特的技术,成功突破了语音和文本之间的差异以及数据缺乏等难题,实现了提高语音翻译准确度的目标。具体来说,ZeroSwot通过使用语音识别数据训练语音编码器,然后将其与...

Read More
2024-02-07 talkingdev

阿里Qwen 1.5多语言模型发布

Qwen 1.5模型发布,参数从0.5B到72B,是一套令人印象深刻的多语言模型。有趣的是,最小的模型是第一个严肃的小于10亿参数的语言模型。

Read More
2024-01-10 talkingdev

开源LLM Gateway,实现多语言模型之间的路由

Portkey AI最近开源了LLM Gateway,实现了多个不同语言模型之间的路由。这个开源项目旨在简化在不同的语言模型之间进行选择和路由的过程,从而更好地利用不同模型的优势,提高语言模型的整体性能。 LLM Gateway是一...

Read More
2023-11-10 talkingdev

Cohere发布业内领先的嵌入模型

Cohere的最新模型是用于与真实世界的嘈杂数据互动的搜索应用的升级,以及用于检索增强生成(RAG)系统的应用。其多语言模型现在支持100多种语言,并可用于搜索同一语言内的内容(例如,在法国文档上使用法语查询进行...

Read More
2023-09-20 talkingdev

CulturaX发布6T多语言数据标记,助推多语言模型发展

在谷歌的新数据集发布后,CulturaX紧随其后,推出了新的数据集。这是一个清洁整理过的多语言数据标记集,总量达到了6T。这一数据集的发布,将为多语言语言模型的进一步发展提供巨大的助力。谷歌和CulturaX的这两次数...

Read More