论文:改变Transformers计算效率,用结构化矩阵替代密集层
talkingdev • 2024-06-12
470876 views
当前,大多数用于Transformers的计算花费在线性层上。这项工作利用muP和Monarch矩阵构建了一个结构化表示,不仅减少了计算量,而且比原始的密集层拥有更好的扩展规则。这项技术可以提高计算效率,降低运算成本,为AI模型的高效运行开辟了新的可能。
talkingdev • 2024-06-12
470876 views
当前,大多数用于Transformers的计算花费在线性层上。这项工作利用muP和Monarch矩阵构建了一个结构化表示,不仅减少了计算量,而且比原始的密集层拥有更好的扩展规则。这项技术可以提高计算效率,降低运算成本,为AI模型的高效运行开辟了新的可能。