机器学习的相关内容 - 漫话开发者

2023-06-02 talkingdev

加速MPT 65K上下文模型

最近MosaicML MPT模型仍然备受欢迎。其中一个重要的贡献是“Storywriter”模型，它可以在上下文中使用高达65k个标记。但是，使用这个模型进行推理非常缓慢。通过添加键/值缓存，我们可以将生成速度提高近10倍。 ## 内...

2023-06-01 talkingdev

最近的一项研究引入了一种开创性的方法，其中大型人工智能（AI）语言系统（LLMs）不仅被训练使用工具，还可以创建自己的工具以更有效地解决问题。这些LLMs开发了自己的“实用函数”，就像小型软件工具包一样，可以用于...

2023-05-31 talkingdev

今天，我们向大家介绍一个名为Threestudio的开源项目。这个项目采用了先进的2D文本到图像生成模型，从文本提示、单张图像和少量样本图像中创建3D内容的统一框架。以下是该框架的三个核心要点： - Threestudio利用...

2023-05-31 talkingdev

Gorilla模型是基于大型语言模型（LLMs）的一种精细模型，显著优于现有模型如GPT-4在编写API调用方面的表现。它帮助语言模型更有效地使用工具。结合文档检索器，Gorilla可以很好地适应更新的文档，最小化不准确的生成...

2023-05-24 talkingdev

近日，一种名为VideoLLM的系统利用语言处理模型的强大能力，将所有视频输入转换为一种可以更高效地分析的语言类型。经过在多个数据集上成功测试，VideoLLM证明它可以处理各种任务，表明语言模型的推理能力可以有效地...

2023-05-24 talkingdev

#### 新闻摘要: - Scikit-LLM将强大的语言模型与scikit-learn无缝集成，提供强大的文本分析能力。 - 开发者可以轻松地使用ChatGPT等语言模型来处理自然语言文本。 - Scikit-LLM使得文本分析任务更加高效和准确。...

2023-05-23 talkingdev

注意力机制和Transformer技术是现代语言模型更加高效的关键，本文将深入探讨它们的作用。 ## 核心要点 - 注意力机制是一种机器学习技术，可使模型更加聚焦于输入中有用的部分。 - Transformer是一种基于注意力机制...

2023-05-22 talkingdev

## 新闻概要： - Meta发布了一款专门用于AI推理工作负载的定制芯片。 - 这款7纳米芯片的功耗较低，与许多替代硬件相比速度相当。 - 尽管与其他科技巨头相比有些安静，但Meta的AI硬件计划仍在积极推进。 ## 详细内...