技术新闻的相关内容 - 漫话开发者

2023-06-07 talkingdev

GGML推出，以纯C语言框架降低本地运行成本

GGML以纯C语言编写的框架，让用户可以在MacBook电脑上轻松运行大型语言模型，这种模型通常在本地运行成本较高。目前，这一框架主要被业余爱好者使用，但在企业模型部署方面也有广泛的应用前景。核心要点： - GGML...

2023-05-31 talkingdev

ProlificDreamer是一种提高文本到3D图像生成效果的新方法。它通过将3D参数视为随机变量来解决文本到3D生成中早期Score Distillation Sampling（SDS）方法中存在的过度饱和和低多样性等问题。这种变分Score Distillat...

2023-05-29 talkingdev

近日，有一篇论文提出了一种新的方法，旨在改进计算机理解和将日常语言转换为SQL的能力。该方法通过查看代码的整个部分而非单个单词来纠正错误，并使用一种新的SQL查询表示法，更接近于现有代码语言模型的工作方式，...

2023-05-26 talkingdev

TWIST是一种新的训练语音语言模型（SpeechLMs）的方法，它使用预先训练的文本模型来进行热启动。该方法优于从头开始训练，经验分析强调了模型和数据集规模的重要性。这项研究介绍了迄今为止最大的SpeechLM，并引入了...

2023-05-25 talkingdev

在项目中尽可能减少认知负荷对于开发人员来说非常重要。平均而言，人们的工作记忆只能容纳大约四个事实。本文讨论了认知负荷以及开发人员应该如何管理它。文章提供了不同方法如何增加或减少认知负荷的示例，并介绍了...

2023-05-22 talkingdev

ONE-PEACE是一种新模型，无需从预先训练的模型开始，就能出色地理解图像、声音和单词，并在涉及视觉、音频和语言的任务中表现出色。它还具有一个独特的功能，可以在不曾共同出现的不同类型的数据之间找到联系，其灵...

2023-05-08 talkingdev

MosaicML最近发布了一种新的语言模型，可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中，并根据其写出一篇结尾。以下是该技术的三个核心要点： - 传统的语言模型只能在...

2023-05-05 talkingdev

最近，研究人员发现了一种更加便宜且节省时间的方法，用于创建新的视觉-语言AI模型。该方法名为VPGTrans，其可从现有模型中转移部分内容，大大加快了速度，使用的数据也更少，可以更轻松地创建强大的AI模型，而不...