研究人员开发出一种名为自压缩神经网络(SCNN)的技术,它可以在不损失精度的情况下大幅减小神经网络的大小。这项技术基于模型剪枝,但不同于传统的剪枝方式,SCNN可以自我压缩和扩张神经网络结构,以适应不同的应用...
Read More近日,一款名为SliceGPT的新一代模型压缩工具问世。据悉,该工具可以适用于从Phi-2等小型模型到大型模型的多种规模,并可对模型的权重矩阵进行剪枝处理,最大程度保持模型质量的同时,实现模型参数的大幅度减少,以...
Read More该仓库介绍了Wanda,一种通过选择性地丢弃不太重要的网络权重来减少大型语言模型复杂性的独特方法。与其他方法不同,Wanda无需重新训练或大量计算,能够在保持性能的同时实现有效的模型剪枝。
Read More