漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-07 talkingdev

GGML推出,以纯C语言框架降低本地运行成本

GGML以纯C语言编写的框架,让用户可以在MacBook电脑上轻松运行大型语言模型,这种模型通常在本地运行成本较高。目前,这一框架主要被业余爱好者使用,但在企业模型部署方面也有广泛的应用前景。 核心要点: - GGML...

Read More
2023-05-31 talkingdev

Github项目ProlificDreamer提升文本到3D图像生成效果

ProlificDreamer是一种提高文本到3D图像生成效果的新方法。它通过将3D参数视为随机变量来解决文本到3D生成中早期Score Distillation Sampling(SDS)方法中存在的过度饱和和低多样性等问题。这种变分Score Distillat...

Read More
2023-05-29 talkingdev

论文介绍新方法:提高文本转SQL的准确性

近日,有一篇论文提出了一种新的方法,旨在改进计算机理解和将日常语言转换为SQL的能力。该方法通过查看代码的整个部分而非单个单词来纠正错误,并使用一种新的SQL查询表示法,更接近于现有代码语言模型的工作方式,...

Read More
2023-05-26 talkingdev

技术新闻:使用文本预热启动来提高语音语言模型性能

TWIST是一种新的训练语音语言模型(SpeechLMs)的方法,它使用预先训练的文本模型来进行热启动。该方法优于从头开始训练,经验分析强调了模型和数据集规模的重要性。这项研究介绍了迄今为止最大的SpeechLM,并引入了...

Read More
2023-05-25 talkingdev

降低认知负荷:开发人员手册 🧠

在项目中尽可能减少认知负荷对于开发人员来说非常重要。平均而言,人们的工作记忆只能容纳大约四个事实。本文讨论了认知负荷以及开发人员应该如何管理它。文章提供了不同方法如何增加或减少认知负荷的示例,并介绍了...

Read More
2023-05-22 talkingdev

新技术发布:ONE-PEACE模型可全面处理视觉、语音和语言任务

ONE-PEACE是一种新模型,无需从预先训练的模型开始,就能出色地理解图像、声音和单词,并在涉及视觉、音频和语言的任务中表现出色。它还具有一个独特的功能,可以在不曾共同出现的不同类型的数据之间找到联系,其灵...

Read More
2023-05-08 talkingdev

新技术发布:MosaicML发布具有更长“上下文”的语言模型

MosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...

Read More
2023-05-05 talkingdev

技术新闻:VPGTrans技术可跨语言模型转移视觉提示生成器

最近,研究人员发现了一种更加便宜且节省时间的方法,用于创建新的视觉-语言AI模型。该方法名为VPGTrans,其可从现有模型中转移部分内容,大大加快了速度,使用的数据也更少,可以更轻松地创建强大的AI模型,而不...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page