漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-09 talkingdev

Stability AI开发高保真度文本转语音模型,使用合成注释训练

这些文本转语音模型由Stability AI开发,可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集,因此其创作者合成注释了大量的语音语料库进行训练。这是注释,上字幕和训练生成模型...

Read More
2024-01-22 talkingdev

儿童故事朗读工具:Tiny Narrations开源

Tiny Narrations是一个基于最受欢迎的Tiny Stories数据集的文本转语音版本。它使用SF Compute H100集群上的XTTS2。这个系统可以将短小精悍的故事转化为音频文件,方便用户在不同场景下收听。这个系统的优点是使用了...

Read More
2024-01-22 talkingdev

WhisperSpeech: 倒置Whisper技术实现的文本转语音系统

WhisperSpeech是一种倒置Whisper技术实现的文本转语音系统。该系统目前仅在英语LibreLight数据集上进行了训练,但未来的版本将面向多种语言。在该仓库中提供了合成语音的示例。

Read More
2024-01-21 talkingdev

自动化流程Agent让博客转视频播客

Nathan Lambert最近发布了Interconnect Tools,它允许您使用文本转语音、图像合成和整个工作流程自动化他的多模式博客流程。它允许创作者专注于写作,而工具将事物格式化为易于消费的媒体,以便他们的受众。此工具可...

Read More
2024-01-16 talkingdev

AutoNarrate开源:用GPT4-V和TTS自动记录生活

最近,一位技术爱好者开发了一个名为AutoNarrate的GitHub Repo,它使用GPT4-V和最先进的文本转语音技术,加上一些屏幕录制软件,可以让像David Attenborough这样的人自动记录你生活中的所有事情。该技术可用于个人日...

Read More
2023-11-21 talkingdev

StyleTTS 2发布:结合风格扩散和对抗训练,实现接近人类自然语音合成

StyleTTS 2是一款文本转语音模型,旨在通过将风格扩散和对抗训练与大型语音语言模型相结合来实现接近人类水平的语音合成。StyleTTS 2是在原有StyleTTS模型的基础上进一步优化,采用了更加先进的多任务学习技术,使得...

Read More
2023-11-20 talkingdev

微软推出深度伪造技术生成器

微软在2023年的Microsoft Ignite活动上推出了Azure AI语音文本转换成语音化身,使用户可以使用文本转语音技术创建能够以多种语言说出预设文本的逼真化身。深度伪造技术是一种利用人工智能技术生成逼真但是虚假的视频...

Read More
2023-11-14 talkingdev

Jupyter Notebook实现超快速语音生成技术

Bark是一种文本转语音系统,它可以生成连贯、快速和超长的音频输出。现在,我们可以在Jupyter Notebook中使用Bark,将文本转换为语音文件,使其更加便捷。Bark使用深度神经网络作为其文本到语音模型,具有很高的准确...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page