LLMs的相关内容 - 漫话开发者

2023-11-30 talkingdev

llamafile：运行在多个CPU微架构上的单文件分发工具

近日，llamafile发布了新的GitHub Repo，它是一种新的单文件分发工具，允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行，而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...

2023-11-20 talkingdev

使用语言模型构建工具是一种新兴的工程学科，涵盖了高性能计算、GPU编排和监控。在这个领域，LLMs（语言模型）是至关重要的组件，它们可以帮助工程师们开发出更智能、更高效的工具。本文将介绍如何在生产环境中使用L...

2023-11-17 talkingdev

最近有人在一只填充的鹦鹉上装上了Mistral的7B型号，这在网上引起了轰动。本文深入探讨了他们用来使其运行的基本思想。

2023-11-16 talkingdev

红木研究的一项研究表明，大型语言模型(LLMs)可以掌握“编码推理”，这是一种隐写术，允许LLMs在生成的文本中嵌入中间推理步骤，使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

2023-11-16 talkingdev

You.com已经推出了一系列API，价格从每月100美元起，使得像Meta的Llama 2这样的大型语言模型可以访问最新的互联网数据，并通过网络搜索和新闻功能提供增强的答案准确性。这些API有助于LLMs从更广泛的数据来源中汲取...

2023-11-14 talkingdev

OpenGPTs是一项旨在创建类似于OpenAI's GPTs的技术的仓库。它允许开发人员配置超过60个LLMs，提示，超过100个工具，向量数据库，检索算法和聊天历史数据库。该项目使用LangChain，LangServe和LangSmith。OpenGPTs的...

2023-11-13 talkingdev

GitHub上有一个新的工具——LongQLoRA，它可以让LLMs（语言模型）理解更长的序列。LLMs已经在自然语言处理方面取得了很大的成功，但它们的上下文理解能力有限。长序列的理解也是LLMs的一个挑战。LongQLoRA通过对序列切...

2023-11-13 talkingdev

近日，一项研究提出了一种更好的数据清洗方法，以确保LLMs的公正测试，并提高它们的可靠性。传统的数据清洗方法可能会导致LLMs训练不公平，因为某些数据可能会被错误地标记或过滤掉。这项研究提出的解决方案可以更好...