漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-19 talkingdev

Linux 2022年版推出多路径TCP

据报道,Linux 2022年版将启用多路径TCP,这将有助于提高网络连接的性能和可靠性。多路径TCP可以同时使用多个网络路径来传输数据,从而增加了网络带宽和容错能力。Linux 2022年版的多路径TCP还将采用一种新的路径选...

Read More
2024-04-12 talkingdev

PoLoPCAC:高效且适应性强的点云压缩新方法

PoLoPCAC代表了一种新型的无损点云属性压缩方法,它不仅压缩效率高,而且对不同规模和密度的点云数据具有良好的适应性。点云数据作为一种重要的三维数据表示形式,在众多领域如自动驾驶、城市规划、虚拟现实等都有着...

Read More
2024-04-08 talkingdev

MLPerf 基准测试新增大型生成型AI模型,Nvidia 系统性能超群

MLPerf 近日更新了其推理基准测试,新增了如 Llama 2 70B 和 Stable Diffusion XL 等大型语言模型,这一变化体现了整个行业对于大型生成型人工智能的转移。在最新测试中,Nvidia 的系统,尤其是搭载了 H200 处理器的...

Read More
2024-04-02 talkingdev

论文:Transformer-Lite,在手机GPU上运行大型语言模型

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段,成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

Read More
2024-03-18 talkingdev

探索LLM推理的“光速”极限

本文深入探讨了基于变换器的语言模型推理的“光速”理论极限,强调了内存带宽相较于计算能力的重要性。文章通过实例展示了推理速度主要受限于从内存中读取数据的能力,而非执行计算的速度,这对于优化和理解AI性能是一...

Read More
2024-01-26 talkingdev

Fuyu-Heavy多模型表现超越Gemini Pro

Adept公司扩大了其Fuyu架构并训练了一个更大的版本,目前是MMMU上排名第三的最佳模型之一。该模型在其他任务中也表现良好(例如,在HumanEval编码基准测试中达到40+)。与其他替代方案相比,扩展此架构的挑战较少,...

Read More
2024-01-12 talkingdev

谷歌不再收取数据传输费用,挑战云计算竞争对手

谷歌云将停止在客户想要离开时收取数据传输费用。这一变化适用于全球所有客户。数据传输费用是技术公司的盈利来源,他们可以通过惩罚客户离开来减少客户流失。谷歌是带宽联盟的一员,该联盟的目标是减少或消除数据传...

Read More
2024-01-08 talkingdev

英特尔称Gaudi 2芯片超越A100

英特尔推出的新芯片在多个平台和本地部署中可用,具有出色的训练吞吐量、浮点运算次数和解码带宽。英特尔的新型AI加速卡Gaudi 2在性能上超越了Nvidia的A100。该芯片采用Intel的海湾科技,这是一种可扩展的、可重复使...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page