GPU的相关内容 - 漫话开发者

2023-06-21 talkingdev

LOMO：高效的LLM训练（GitHub开源）

这项研究介绍了LOw-Memory Optimization（LOMO），这是一种旨在显著减少大型语言模型（LLM）训练所需资源的优化器，目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU（每个具有24...

2023-06-19 talkingdev

本文讨论了几种加速大型语言模型（LLM）训练和推理的技术，以使用高达100K个输入令牌的大上下文窗口。这些技术包括：ALiBi位置嵌入，稀疏注意力，闪电注意力，多查询注意力，条件计算以及使用80GB的A100 GPU。

2023-06-19 talkingdev

Nvidia A100是市场上最强大的GPU之一。它们已被用于训练迄今为止最流行的模型之一。它们是数据中心的GPU，通常意味着您无法在自己的硬件上运行它们。本文探讨了如何以几千美元的价格自己组装一个本地运行的A100超级...

2023-06-19 talkingdev

这家中国巨头已经从NVIDIA购买了约10万个GPU，用于不同的人工智能项目。这些订单是在对GPU出口进行监管限制之前下达的。这是又一家通过计算能力增强其人工智能努力的公司。

2023-06-14 talkingdev

AMD推出的MI300X人工智能GPU将于今年秋季后期提供样片，并在明年开始大量出货。目前，Nvidia在AI芯片市场上占据着超过80%的市场份额。尽管AMD尚未披露芯片的价格，但其发布可能会对Nvidia的GPU造成压力，Nvidia的GPU...

2023-06-14 talkingdev

据报道，一些知名天使投资者为初创企业建立了一个巨大的计算机集群，以便其用于训练模型。该集群提供了2K H100 GPU。 ## 内容要点：以下是该新闻的三个核心要点： - 一些知名天使投资者为初创企业建立了一个计算...

2023-05-30 talkingdev

近日，全新的DGX系统面世了！节点之间的NVLink连接创造了一个由256个Grace CPU（每个CPU拥有480GB的LPDDR5内存）和256个Hopper GPU（每个GPU拥有96GB的HBM3内存）组成的系统。每个GPU可以以900Gbps的速度直接访问任...

2023-05-26 talkingdev

## 新闻概要： - Nvidia股票在周四猛涨28%，这标志着AI芯片繁荣的全面到来。 - 这一消息表明，市场对AI芯片的需求在不断增加。 - Nvidia是全球领先的人工智能公司，其GPU芯片是训练和运行深度学习算法的最佳选择。...