漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-05 talkingdev

DeepMind研究实现Transformer模型动态计算优化

现代变压器模型在处理数据时,每个数据单元都使用相同的预测计算量,但事实上,不同数据单元的预测难度差异很大。DeepMind的最新研究突破了这一限制,允许模型在生成过程中根据数据单元的难易程度提前退出,从而减少...

Read More
2024-03-19 talkingdev

英伟达宣布推出新一代AI芯片,旨在提升AI模型运算能力

英伟达在其开发者大会上宣布了新一代人工智能芯片及软件。这款名为Blackwell的AI图形处理器预计将于今年晚些时候出货。同时推出的NIM软件旨在简化AI的部署过程。英伟达力求通过NIM软件使得所有模型能够在其所有GPU上...

Read More
2023-08-30 talkingdev

适应性计算阅读清单,探索属于你的模型运算选择

适应性计算是一种模型可以选择对于给定任务应使用多少计算(例如,使用多少参数)的理念。这可能包括基于搜索的采样方法或专家模型的混合。这个阅读清单正在积极维护并且非常详尽。适应性计算的概念更新迅速,这个阅...

Read More