漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-08-09 talkingdev

OTranscribe-免费的音频采访转录工具

OTranscribe是一款免费开放的音频采访转录工具,可以轻松地将音频转录为文本。OTranscribe具有自动备份、快捷键、文本格式自定义等功能,使得音频转录更加高效、方便。OTranscribe使用简单,只需将音频文件拖放到工...

Read More
2023-11-29 talkingdev

InsanelyFastWhisper即时音频转录工具

Insanely Fast Whisper with Speaker Diarization是一款针对音频文件的命令行工具,具有较强的自动转录能力。该工具还包括说话人分割和区分(例如,识别说话人1与说话人2)。该工具声称即使在一些最大的模型上,也能...

Read More
2023-10-31 talkingdev

开源Whisper Large v2音频转录速度破纪录

OpenAI的Whisper Large v2音频转录模型发布了。这个模型采用了非常先进的技术,可以在不到10分钟的时间内转录出300分钟的音频。这一速度远远超过了之前的音频转录模型,对于信息的获取和处理提供了极大的便利。这个...

Read More
2023-10-17 talkingdev

Insanely Fast Whisper: 使用OpenAI模型,300分钟音频转录不到10分钟

Insanely Fast Whisper是一个使用OpenAI的Whisper Large v2模型的音频转录工具,它可以在不到10分钟的时间内转录300分钟的音频。该工具快速且易于使用,同时可提供基准测试结果。

Read More
2023-09-26 talkingdev

Spotify借助AI技术推出克隆和翻译播客者音频的新功能

近日,Spotify推出一项由AI驱动的语音翻译功能,该功能能够利用原播客者的声音在其他语言中复制播客节目。这项技术依赖于OpenAI的Whisper进行转录,很可能用于声音复制,使得翻译能够保持播客者独特的声音。这一创新...

Read More