漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-23 talkingdev

HuggingFace发布针对3D并行的代码库Nanotron

近日,HuggingFace发布了一个名为Nanotron的小型而强大的库,用于训练具有3D并行性的模型。这意味着它将数据、模型和模型中的层/张量分割开来。前两种并行性在PyTorch等库中得到了很好的支持。然而,将模型张量分割...

Read More