漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

Hazy研究推出全新CUDA内核DSL——ThunderKittens

talkingdev • 2024-05-13

373608 views

Hazy研究团队最新推出一款名为ThunderKittens的CUDA DSL,旨在帮助开发者更简单、更高效地编写CUDA内核。据了解,该团队已经用这款新工具编写了flash attention模块,结果表明其运行速度比原版本快了30%,而且仅需100行代码即可完成。这无疑将大大提高开发者在处理CUDA内核编程时的效率和便捷性,对于深度学习、AI等高性能计算领域具有重要的推动价值。

核心要点

  • Hazy研究团队推出新型CUDA DSL——ThunderKittens
  • 使用这款工具编写的flash attention运行速度比原版快30%
  • ThunderKittens将提高CUDA内核编程的效率和便捷性

Read more >