漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-30 talkingdev

llamafile:运行在多个CPU微架构上的单文件分发工具

近日,llamafile发布了新的GitHub Repo,它是一种新的单文件分发工具,允许任何人使用单个文件分发和运行LLMsLLMs可以在多个CPU微架构上运行,而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...

Read More
2023-11-20 talkingdev

生产级LLM工具开发者指南

使用语言模型构建工具是一种新兴的工程学科,涵盖了高性能计算、GPU编排和监控。在这个领域,LLMs(语言模型)是至关重要的组件,它们可以帮助工程师们开发出更智能、更高效的工具。本文将介绍如何在生产环境中使用L...

Read More
2023-11-17 talkingdev

如何在树莓派上运行LLMs

最近有人在一只填充的鹦鹉上装上了Mistral的7B型号,这在网上引起了轰动。本文深入探讨了他们用来使其运行的基本思想。

Read More
2023-11-16 talkingdev

LLM可使用隐写术隐藏推理过程

红木研究的一项研究表明,大型语言模型(LLMs)可以掌握“编码推理”,这是一种隐写术,允许LLMs在生成的文本中嵌入中间推理步骤,使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

Read More
2023-11-16 talkingdev

You.com推出新API,为LLMs连接互联网提供支持

You.com已经推出了一系列API,价格从每月100美元起,使得像Meta的Llama 2这样的大型语言模型可以访问最新的互联网数据,并通过网络搜索和新闻功能提供增强的答案准确性。这些API有助于LLMs从更广泛的数据来源中汲取...

Read More
2023-11-14 talkingdev

开源GPTs:GitHub仓库OpenGPTs发布

OpenGPTs是一项旨在创建类似于OpenAI's GPTs的技术的仓库。它允许开发人员配置超过60个LLMs,提示,超过100个工具,向量数据库,检索算法和聊天历史数据库。该项目使用LangChain,LangServe和LangSmith。OpenGPTs的...

Read More
2023-11-13 talkingdev

LongQLoRA:提升LLMs上下文理解能力

GitHub上有一个新的工具——LongQLoRA,它可以让LLMs(语言模型)理解更长的序列。LLMs已经在自然语言处理方面取得了很大的成功,但它们的上下文理解能力有限。长序列的理解也是LLMs的一个挑战。LongQLoRA通过对序列切...

Read More
2023-11-13 talkingdev

论文:优化数据清洗方案,提高LLMs的训练效果

近日,一项研究提出了一种更好的数据清洗方法,以确保LLMs的公正测试,并提高它们的可靠性。传统的数据清洗方法可能会导致LLMs训练不公平,因为某些数据可能会被错误地标记或过滤掉。这项研究提出的解决方案可以更好...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page