漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-01 talkingdev

QUICK:加速LLM的新CUDA内核开源

QUICK是一套新的优化CUDA内核,通过解决内存问题,提升了大型语言模型的效率。这导致了NVIDIA GPU上的显著速度提升,使AI模型运行更快,效率更高。QUICK的出现,无疑为AI领域带来了新的可能性,通过优化内存处理方式...

Read More
2023-12-19 talkingdev

Pytorch内存问题的疑难解答

对于使用Pytorch的从业者来说,最大的挑战之一就是弄清楚为什么会出现内存不足的情况。在Pytorch 2.1中提供了一些令人惊叹的新工具,可以了解内存使用情况。甚至可以将使用情况分类为熟悉的桶(例如,激活,梯度)。

Read More