漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-09 talkingdev

浏览器如何隔离内部音频和麦克风输入?

近日有网友发出问题:浏览器如何隔离内部音频和麦克风输入?对此,业内专家指出,浏览器为了保护用户的隐私,会采取一系列技术手段来隔离内部音频和麦克风输入,比如使用WebRTC API(Web Real-Time Communications A...

Read More
2024-07-09 talkingdev

SenseVoice开源:具有多重语音情感理解能力的基础模型

近日,GitHub发布了一款名为SenseVoice的语音基础模型。这款模型拥有多重语音理解能力,包括自动语音识别、口语语言识别、语音情感识别以及音频事件检测。自动语音识别技术可以实现对人类语音的智能理解;口语语言识...

Read More
2024-04-30 talkingdev

Whisper-cli:可本地部署的开源语音识别系统

近日,Ruff的开发团队发布了一款名为Whisper cpp cli的全新语音识别系统,该系统已在GitHub Repo上开源。这是一款完全自主研发的语音转文字系统,基于Whisper技术构建。Ruff团队一直以创新技术和高品质服务闻名于业...

Read More
2024-03-11 talkingdev

微软或将于本月推出首款'AI PC'

微软即将于3月21日公开展示Surface Pro 10和Surface Laptop 6,这两款电脑将配备最新的神经处理单元,可提升人工智能能力。这些电脑将由英特尔的第11代酷睿处理器提供动力,其内置的AI引擎可提供更快的AI处理速度和...

Read More
2023-12-21 talkingdev

Distil Whisper:新的语音识别技术比 Whisper 更快、更小、误差不到1%

Distil-Whisper 是 Whisper 的精简版本,比 Whisper 更快、更小,且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术,包括低秩分解和知识蒸馏,以实现...

Read More
2023-11-13 talkingdev

三星展示AI实时翻译功能,将于2024年发布

三星一直在人工智能领域保持低调,但最近展示了一项用于电话的实时AI翻译功能。该功能预计将于2024年发布。这项新技术将允许用户在电话中进行实时翻译,无需等待或使用第三方应用。三星表示,这项功能将使用自然语言...

Read More
2023-10-20 talkingdev

$13M种子轮融资用于构建企业低代码多模式搜索工具包

Objective公司已经完成了一轮种子融资,以便为企业构建低代码多模式搜索工具包。这款工具包将使用自然语言处理、计算机视觉和语音识别技术,可以帮助企业快速构建自定义搜索引擎,减少搜索时间。Objective的目标客户...

Read More
2023-10-11 talkingdev

迪士尼将大情感注入小机器人

迪士尼研发出一款名为Wall-E的小机器人,这是一款拥有超强情感的小机器人,它可以感知人类的情感,并生成相应的情感反馈,比如当你难过时,它会伸出小臂给你拥抱。这项技术是迪士尼为打造更好的主题公园体验所研发的...

Read More
  1. Next Page