漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-24 talkingdev

RWKV模型:结合Transformer和循环神经网络的最佳文本处理工具

### 内容摘要: - Transformer已经取代循环神经网络成为大多数文本处理任务的主要工具。 - 由于架构的限制,这些Transformer很昂贵且上下文受限。 - RWKV是一种具有注意力变体的模型,它声称结合了Transformer和循...

Read More
2023-05-23 talkingdev

探索注意力机制和Transformer技术

注意力机制和Transformer技术是现代语言模型更加高效的关键,本文将深入探讨它们的作用。 ## 核心要点 - 注意力机制是一种机器学习技术,可使模型更加聚焦于输入中有用的部分。 - Transformer是一种基于注意力机制...

Read More
2023-05-17 talkingdev

首个RNN在Transformers库中发布

近日,基于线性注意力模型与内置循环的RWKV模型成为Transformers库中首个推出的RNN模型。该模型是一个强大的语言模型,理论上可运行较长的上下文窗口,并具有快速的运行速度。目前,该模型在HuggingFace平台上的开发...

Read More
2023-05-12 talkingdev

新AI代码审查工具Metabob发布

Metabob是一款AI代码审查工具,能够自动检测、理解和解决隐藏在代码中的复杂问题,加速代码调试。Metabob的理解代码上下文的能力超级强大,可以增强其检测能力! ## 核心要点 以下是Metabob推出的三个核心要点:...

Read More
2023-05-12 talkingdev

Anthropic模型升级:100k上下文标记突破

Anthropic最新消息,其Claude模型现已可处理更长上下文标记。这意味着,您的组织可以将完整文档输入模型,语言模型将会对其进行操作。他们举了一个例子,将240页编码文档输入Claude,并让其回答编码问题。目前尚未公...

Read More
2023-05-09 talkingdev

新型注意力机制提升网页理解能力

近日,研究人员开发出新的维基百科网页套件(WikiWeb2M),旨在提高多模态网页理解能力,该套件包含200万个网页和一种特殊的注意力机制,可提高生成描述、总结部分和创建上下文图像标题等任务的性能。 ## 主要内容...

Read More
2023-05-09 talkingdev

RasaGPT:首个基于Rasa和Langchain构建的无头LLM聊天机器人平台

**内容摘要:** - RasaGPT是基于Rasa和Langchain构建的首个无头LLM聊天机器人平台。 - 该平台提供了Rasa和Telegram的样板代码和参考实现,利用类似Langchain的LLM库进行索引、检索和上下文注入。 - RasaGPT为开发人...

Read More
2023-05-08 talkingdev

新技术发布:MosaicML发布具有更长“上下文”的语言模型

MosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page