漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-06 talkingdev

Nous研究使用Yarn方法优化Mistral 7B模型,可处理长达128k的语境

Nous研究利用他们的Yarn方法对Mistral 7B进行了微调,可以处理长达128k的语境。它在短序列长度上显示出最小的退化,并在长文档上大大提高了性能。

Read More
2023-11-03 talkingdev

Nous Research运用Yarn方法,将Mistral 7B模型扩大到128k上下文

Nous Research运用他们的Yarn方法来优化Mistral 7B的性能,使其可以处理长达128k的上下文。该方法在短序列长度上表现良好,并可以显著提高处理长文档的性能。

Read More
2023-10-25 talkingdev

Yarn 4.0发布:引入加固模式,提供更多命令和功能

Yarn 4.0已经发布。它引入了一个新的加固模式,可以执行额外的验证,防止攻击者在使用Yarn时修改锁定文件。此外,该更新还在主分发版中实现了许多常用的功能和命令,使用户可以在没有插件的情况下访问它们。本文将讨...

Read More