漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities(BASE TTS),该模型拥有980万个参数,并具有新兴特性,可以自然地讲述甚至是复杂的句子。该模型是当前最大的文本转语音AI模型之一,旨在提高语音合成的质量和自然度。 BASE TTS的新兴特性使其可以根据上下文自动调整语音发音,从而产生更加自然的语音效果。除此之外,该模型还可以自我评估和自我纠正,从而不断改善语音合成的质量。目前,BASE TTS已经在Alexa等亚马逊产品中得到应用。

核心要点

  • 亚马逊发布新的文本转语音模型BASE TTS,拥有980万个参数。
  • 该模型具有新兴特性,可以自然地讲述复杂的句子。
  • BASE TTS的新兴特性可以根据上下文自动调整语音发音,从而产生更加自然的语音效果。

Read more >