漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-04 talkingdev

Stability AI推出Stable Audio 2.0音乐生成模型

Stability AI近日宣布了其音乐生成模型的下一代产品——Stable Audio 2.0。该模型通过合法授权的音乐数据进行训练,能够生成长达3分钟的高质量音乐作品。Stable Audio 2.0还具备音频到音频的生成技术,这意味着用户可...

Read More
2024-02-09 talkingdev

Google MusicLM团队使用RL技术提升音乐生成模型表现

Google的MusicLM团队使用了300k份反馈和其他奖励信号,在其音乐生成模型上运行了RL过程。他们发现该模型在人类偏好研究中表现优异,但尚不清楚哪种RL方法能产生最高保真度的输出。

Read More
2023-11-20 talkingdev

音乐领域的ControlNet开源

ControlNet是一种为图像合成模型提供细粒度控制的新颖方法。现在有一种类似的音乐生成模型,可以让您控制许多特征,如语音和音调。这种新型音乐生成模型可以为音乐家们提供更多的创作可能性,使其更好地掌握音乐创作...

Read More
2023-08-29 talkingdev

AudioLDM2-声音与音乐生成模型开源

近日,一款出色的开源声音与音乐生成模型在GitHub上引发关注。这款模型运行速度快,能生成节拍、音效和基础对话。操作简单,且对提示样式具有较强的鲁棒性。该模型的出现,无疑为音频处理领域的发展注入了新的活力,...

Read More