漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-09-14 talkingdev

参数化扬声器实现“Rickroll”激光效果

近日,科技爱好者们成功研发出一种新型的参数化扬声器,能够通过激光传输音频信号,从而实现经典的“Rickroll”效果。这项技术利用了参数化声学原理,将音频信息嵌入激光束中,接收者只需在激光照射范围内即可清晰听到...

Read More
2024-07-08 talkingdev

fun-audio:发布超强音频理解与生成模型

近日,Tongyi语音团队发布了他们的最新成果,一套超强的音频理解与生成模型。这套模型的发布,无疑将大大推动音频技术的发展与进步。模型的理解部分,能够准确分析出音频中的各种元素和信息,包括但不限于音质、音色...

Read More
2024-01-26 talkingdev

DiffMoog音频技术开源:结合神经网络的模块化合成器

DiffMoog是一种新的音频技术,它将模块化合成器的多功能性与神经网络的强大结合起来。它可以实现自动化声音匹配和定制声音的创建,使其成为音频合成的有价值的工具。该技术已在GitHub上发布。

Read More
2023-09-04 talkingdev

论文:深度学习助力全能音效移除系统的构建

近期,音频深度学习领域焕发新生。通过使用一个分类器,接着是特定效果的模块,我们可以构建一个全能系统,逐步从已混合的音频中移除混响或延迟等效果。这种技术不仅能够增强音频处理的效率,还能改进音频的整体质量...

Read More
2023-08-03 talkingdev

Meta发布AudioCraft:一站式生成音频需求的代码库

Meta最新发布的AudioCraft,是一款满足所有生成音频需求的一站式代码库,包括音乐、音效和压缩。AudioCraft的出现,改变了过去我们需要使用多个工具和平台才能完成的音频生成任务,现在只需要这个代码库,就能轻松完...

Read More