漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-08 talkingdev

fun-audio:发布超强音频理解与生成模型

近日,Tongyi语音团队发布了他们的最新成果,一套超强的音频理解与生成模型。这套模型的发布,无疑将大大推动音频技术的发展与进步。模型的理解部分,能够准确分析出音频中的各种元素和信息,包括但不限于音质、音色...

Read More
2024-07-04 talkingdev

法国实验室Kyutai Moshi研发出低延迟的纯音频LLM

Kyutai,一家法国的开放研究实验室,成功地训练出一款具有极低延迟的纯音频LLM。他们成功地创建了一个令人印象深刻的演示,将在未来几个月内开源。Kyutai的这项工作表明,纯音频LLM的实现并不遥不可及,只是需要在技...

Read More
2024-06-30 talkingdev

LosslessCut:无损视频/音频编辑的瑞士军刀

LosslessCut是一款免费、开源的视频/音频编辑工具,可以快速剪辑、裁剪、分离、合并视频/音频文件,而且完全不会影响文件的原始质量。它非常适用于需要快速剪辑视频/音频的人,比如YouTuber、播客、视频爱好者等等。...

Read More
2024-06-28 talkingdev

ElevenLabs首款iOS应用——AI音频阅读器上线

ElevenLabs正式发布了其首款iOS应用,名为“ElevenLabs Reader: AI Audio”。这款应用设计用于将文本文件或网页链接转换为音频讲述,用户在出行时也能听取内容。ElevenLabs Reader: AI Audio旨在提升用户的信息获取方...

Read More
2024-06-13 talkingdev

Meta推出低比特率音频编解码器 MLow

根据最新消息,Meta刚刚推出了一款全新的低比特率音频编解码器 MLow。这款编解码器可将高质量音频压缩至更小的文件大小,具有更快的加载速度和更少的带宽需求。据Meta介绍,该编解码器使用了先进的人工智能技术,可...

Read More
2024-06-06 talkingdev

Stability AI发布Stable Audio技术,可生成高品质音效

Stability AI近日在Hugging Face Hub平台上发布了Stable Audio的权重。Stable Audio是一种训练生成音效的技术,该技术基于许可音频样本进行训练。通过这一技术,用户可以生成各种高品质的音效,应用于游戏开发、电影...

Read More
2024-06-05 talkingdev

NX-AI发布xLSTM代码

近日,NX-AI宣布发布了他们的xLSTM代码。xLSTM是一种基于LSTM的模型,用于处理序列数据的分类和回归问题。与传统的LSTM相比,xLSTM具有更好的性能和效率。这个代码的发布将使更多的人能够使用xLSTM,并将其应用于各...

Read More
2024-06-04 talkingdev

AI引领沟通革命:GPT-4o的多模态集成

AI正在引领一场沟通革命,特别是由OpenAI的GPT-4o所推动的。这项技术在实时集成音频、视觉和文本方面取得了重大突破,使得人与AI之间的互动更加自然。这种转变不仅将人机沟通提升为数字互动的核心模式,还可能带来深...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page