漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

Meta开源新模型训练优化器代码,无需LR调度

talkingdev • 2024-04-08

474406 views

Meta的研究团队近日推出了一款新型的优化器,并已在X平台上公开代码及其多种集成方式。这款优化器的独特之处在于它不依赖于学习率(LR)调度,训练过程中无需预先设定总步数。经过实证,该优化器在包括语言模型在内的多种问题上均展现出良好的性能。

核心要点

  • Meta发布无LR调度的新型优化器
  • 训练过程无需预设总步数
  • 适用于多种问题,包括语言模型

Read more >