漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-10-14 talkingdev

Play 3.0 mini:轻量级、多语种TTS模型的可靠新选择

Play 3.0 mini是一款轻量级的多语种文本转语音(TTS)模型,专为追求成本效益和可靠性的用户设计。该模型在多个语言之间提供高质量的语音输出,适用于各种应用场景,从教育到娱乐,兼具灵活性和实用性。Play 3.0 min...

Read More
2024-07-01 talkingdev

DEX-TTS:一种新型富有表现力的文本转语音模型

DEX-TTS是一种全新的富有表现力的文本转语音(TTS)模型,它采用参考语音来改善风格表示和模型泛化。这种新型技术的出现,为语音技术领域开创了新的可能性。DEX-TTS模型通过参考语音,能够更准确地捕捉到语音风格的...

Read More
2024-06-25 talkingdev

本地语音聊天机器人June:结合Ollama、Hugging Face Transformers和Coqui TTS Toolkit的能力

最近,一款名为“June”的本地语音聊天机器人引起了业界的注意。这款聊天机器人结合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的技术,实现了高效的人工智能对话功能。“June”通过这三种强大的工具,可以...

Read More
2024-06-25 talkingdev

Toucan-基于全球7000种语言的文本转语音TTS模型开放

近期,Toucan发布了一套新的文本转语音模型,这套模型已经扩展,可以支持所有ISO-639-3标准语言。这个开创性的举措,将使全球各地的用户都能享受到语言转换的便利。无论是在学习、工作,还是日常生活中,这都是一项...

Read More
2024-06-20 talkingdev

开源Dot:让本地LLMs和TTS/RAG交互更便捷

近日,一个名为Dot(GitHub Repo)的开源应用引起了大家的关注。这是一个独立的开源应用,其主要目的是让用户更轻松地使用本地LLMs(语言模型)和RAG(重新生成的注意力引导)来与文档和文件进行交互。这种交互方式...

Read More
2024-06-11 talkingdev

Coqui.ai TTS:一款用于文本转语音的深度学习工具包

Coqui.ai TTS是一款用于文本转语音的深度学习工具包,它支持多种语言和声音风格,并可在较低的计算资源上实现高质量的语音合成。该工具包基于TensorFlow 2和PyTorch,是一款开源、易于使用的工具,可帮助研究人员和...

Read More
2024-03-25 talkingdev

DeepGram推出Aura:实现低于250毫秒的低延迟文本转语音API

DeepGram公司近日推出了一项名为Aura的创新产品,这是一款文本转语音(TTS)API,其最引人注目的特性是拥有低于250毫秒的响应延迟时间。这一技术突破意味着用户可以在实时应用中获得更快的语音反馈,极大提升了交互...

Read More
2024-02-22 talkingdev

亚马逊AGI团队称其人工智能展示了“新能力”

亚马逊AGI研究人员开发了一种名为“具有新兴能力的大适应流式TTS”(BASE TTS)的语言模型,它在对话文本中表现出“最先进的自然度”,展示了它没有专门训练的语言技能。

Read More
2024-02-15 talkingdev

亚马逊发布史上最大的文本转语音AI模型,拥有“新兴能力”

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities(BASE TTS),该模型拥有980万个参数,并具有新兴特性,可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

Read More
2024-01-22 talkingdev

儿童故事朗读工具:Tiny Narrations开源

Tiny Narrations是一个基于最受欢迎的Tiny Stories数据集的文本转语音版本。它使用SF Compute H100集群上的XTTS2。这个系统可以将短小精悍的故事转化为音频文件,方便用户在不同场景下收听。这个系统的优点是使用了...

Read More
  1. Next Page