漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

微软DeepSpeed更新,fp6模型推理速度提升超过2倍

talkingdev • 2024-03-11

554739 views

微软的强大DeepSpeed训练库更新了,可以让模型每个参数使用6位。这可以将推理速度提升超过2倍。

核心要点

  • 微软DeepSpeed库更新,fp6模型推理速度提升超过2倍
  • DeepSpeed训练库的更新可以让模型每个参数使用6位
  • 这可以将推理速度提升超过2倍

Read more >