自然语言的相关内容 - 漫话开发者

2024-03-01 talkingdev

LLMs使用Dual Chunk Attention处理10万个令牌

Dual Chunk Attention（DCA）扩展了大型语言模型（如Llama2 70B）的能力，使它们能够处理超过100k个令牌而无需额外的训练。它将注意力计算分解成块，增强了模型对短期和长期上下文的理解。

2024-02-29 talkingdev

IR-QLoRA是一种新方法，它可以提高量化大型语言模型的准确性，使它们更适合在资源有限的设备上使用。量化是一种通过降低浮点精度来减少计算资源需求的技术。虽然这种方法可以大大减少模型的计算量和存储空间，但它也...

2024-02-29 talkingdev

FuseChat推出了一种创新的方式，将多个大型语言模型的优势融合成一个更强大的模型，而不需要进行高成本的从头训练。

2024-02-28 talkingdev

HuggingFace Hub 近期合并发布了 AlphaMonarch 7B 模型，这个经过调优的模型在 elo 和 static benchmarks 中表现优异。它专门为多轮对话和指令跟踪等任务而设计，将会成为自然语言处理领域的一大利器。

2024-02-27 talkingdev

这是一份关于使用LLMs进行注释的精选论文列表，LLMs是一种基于机器学习的语言模型，能够自动预测文本中的下一个单词或字符。使用LLMs进行注释可以提高注释的准确性和效率，目前在自然语言处理和计算机视觉领域被广泛...

2024-02-27 talkingdev

Mindy是一款基于电子邮件的首席助手，由人工智能驱动。这个应用程序旨在帮助用户使用电子邮件系统来管理他们的时间和任务。Mindy使用自然语言处理和机器学习来识别电子邮件中的任务和约会，并将它们自动添加到用户的...

2024-02-26 talkingdev

去年，Mozilla担任了效率挑战的可扩展评估者。它确保参赛者遵守比赛规则并评估模型性能。这篇文章是语言模型评估和竞争性训练方案的良好介绍。本次比赛对推动自然语言处理技术的发展具有重要意义。

2024-02-23 talkingdev

苹果正在开发一个更新版本的Xcode，包括一个AI工具来生成代码。该工具将使用机器学习和自然语言处理算法来识别软件开发中的常见模式和问题，并提供自动生成代码的功能。这将帮助开发人员更快地创建应用程序，提高效...