漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-09 talkingdev

深入理解GPT分词器

## 概述 本文讨论GPT分词器,这是大型语言模型用于将文本转换为预测所需的标记。我们介绍了一个Observable笔记本工具,它允许用户将文本转换为标记,反之亦然,并在完整的标记表中运行搜索。 ## 核心要点 - GPT分词...

Read More
2023-06-08 talkingdev

AI现状:14张图表展示现在的AI技术发展趋势

## 新闻概要: 以下是这篇文章中的三个核心点: - 技术的兴衰周期在当今被压缩得非常紧密。传统技术发展18个月的速度,如今在AI的带动下,瞬息万变。 - 资金和人才正在涌入AI领域,这是一个非常有趣的趋势。 - 现...

Read More
2023-06-07 talkingdev

GGML推出,以纯C语言框架降低本地运行成本

GGML以纯C语言编写的框架,让用户可以在MacBook电脑上轻松运行大型语言模型,这种模型通常在本地运行成本较高。目前,这一框架主要被业余爱好者使用,但在企业模型部署方面也有广泛的应用前景。 核心要点: - GGML...

Read More
2023-06-07 talkingdev

研究人员开发了HQ-SAM模型,帮助改善图片分割效果

研究人员开发了HQ-SAM模型,对最近的“Segment Anything Model”(SAM)进行了升级,提高了其轮廓识别复杂结构对象的能力。该模型保留了原有的优点。 ### 核心要点: - 研究人员开发了HQ-SAM模型,对最近的“Segment...

Read More
2023-06-06 talkingdev

无需提示的扩散,文本转图像更进一步 (GitHub仓库)

最近,研究人员在文本转图像(T2I)领域中推出了一种新的方法,称之为“无需提示的扩散”。这种系统只依靠视觉输入生成图像,无需任何文本提示。其利用了一种称为“语义上下文编码器(SeeCoder)”的独特结构来解释参考...

Read More
2023-06-05 talkingdev

谷歌推出生成式AI课程

## 新闻内容: - 虽然这个领域正在快速发展,但生成式机器学习的基础已经相当稳固。 - 这个由9部分组成的课程涵盖了很多内容,适合对该领域感兴趣的人学习。 - 最终目标是将新用户引入他们的ML云产品Vertex。即使如...

Read More
2023-06-05 talkingdev

开源项目:AWQ技术让大型AI模型更小更快

最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...

Read More
2023-06-02 talkingdev

Lance:现代机器学习数据格式

Lance是一种现代的机器学习数据格式。它提供了更快的随机访问、向量索引、数据版本控制等功能。Lance支持pandas、duckdb、polars和pyarrow等工具,可用于构建搜索引擎和特征库、大规模机器学习训练,以及存储、查询...

Read More
  1. Prev Page
  2. 36
  3. 37
  4. 38
  5. Next Page