漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-12 talkingdev

LLM推理速度如何实现100倍提升

随着开放模型在许多企业任务中变得有用,人们开始探索部署优化。然而,这个领域很复杂且分散。本文深入探讨了许多用于加速语言模型服务的标准技术。

Read More
2023-11-07 talkingdev

Deepspeed开源推理工具软件发布

Deepspeed推出了一款新软件,旨在与vLLM和文本生成界面竞争,以快速提供语言模型服务。该软件配备了许多最先进的加速功能,初步结果表明,速度提升了2.4倍。

Read More