漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-22 talkingdev

儿童故事朗读工具:Tiny Narrations开源

Tiny Narrations是一个基于最受欢迎的Tiny Stories数据集的文本转语音版本。它使用SF Compute H100集群上的XTTS2。这个系统可以将短小精悍的故事转化为音频文件,方便用户在不同场景下收听。这个系统的优点是使用了...

Read More
2024-01-16 talkingdev

AutoNarrate开源:用GPT4-V和TTS自动记录生活

最近,一位技术爱好者开发了一个名为AutoNarrate的GitHub Repo,它使用GPT4-V和最先进的文本转语音技术,加上一些屏幕录制软件,可以让像David Attenborough这样的人自动记录你生活中的所有事情。该技术可用于个人日...

Read More
2023-11-21 talkingdev

StyleTTS 2发布:结合风格扩散和对抗训练,实现接近人类自然语音合成

StyleTTS 2是一款文本转语音模型,旨在通过将风格扩散和对抗训练与大型语音语言模型相结合来实现接近人类水平的语音合成。StyleTTS 2是在原有StyleTTS模型的基础上进一步优化,采用了更加先进的多任务学习技术,使得...

Read More
2023-09-15 talkingdev

Coqui发布新一代文本转语音模型

科技公司Coqui近日公布了其新型文本转语音模型xtts的权重参数。该模型能够克隆语音参数,并能进行多语种的合成。此项技术的出现,无疑是对人工智能领域的一大贡献,预计将在语音合成、语音识别等多个应用领域发挥巨...

Read More
  1. Prev Page