Google MusicLM团队使用RL技术提升音乐生成模型表现

talkingdev • 2024-02-09

644055 views

Google的MusicLM团队使用了300k份反馈和其他奖励信号，在其音乐生成模型上运行了RL过程。他们发现该模型在人类偏好研究中表现优异，但尚不清楚哪种RL方法能产生最高保真度的输出。