漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-22 talkingdev

WhisperPlus,高质量语音转文字技术开源

近日,WhisperPlus正式发布。据悉,该开源项目采用了先进的语音转文字处理技术,能够实现高质量、高准确性的语音转文字功能。此外,该项目还支持多种语言和方言,可广泛应用于语音转写、智能客服等领域。WhisperPlus...

Read More
2023-12-22 talkingdev

MossFormer2模型在单声道语音分离方面取得新进展

MossFormer2模型是MossFormer的改进版,该模型在单声道语音分离方面具有更好的性能。在MossFormer2中,通过引入一个基于复数的非线性激活函数和一个基于深度可分离卷积的上下采样结构,从而提高了模型的分离能力。此...

Read More
2023-12-22 talkingdev

tinyzero:让任何人都能在任何环境中轻松训练类AlphaZero的智能体

由DeepMind开发的AlphaZero程序可以精通诸如国际象棋、日本象棋和围棋等游戏。现在,tinyzero可以让任何人都能轻松训练类似AlphaZero的智能体,无论是在游戏中还是在其他环境中。tinyzero是GitHub上的一个开源项目,...

Read More
2023-12-21 talkingdev

TokenAny-可对任何事物进行标记

近日,GitHub仓库上线了一款全新的模型,可同时进行图像分割、识别和标注,超越了之前的能力。这个新模型的优势在于可以标记任何事物,不再局限于传统的图像和文本。目前,该模型已经在多个领域得到了广泛的应用,包...

Read More
2023-12-21 talkingdev

LLMLingua-对齐后的LLM检测提示中的无关标记,实现对黑盒LLM的压缩推理

近日,一项名为LLMLingua的新项目在GitHub上开源。该项目使用对齐后的小型语言模型检测提示中的无关标记,并实现对黑盒LLM的压缩推理,从而实现了高达20倍的压缩比,且性能损失最小。简言之,LLMLingua能够帮助开发...

Read More
2023-12-21 talkingdev

Distil Whisper:新的语音识别技术比 Whisper 更快、更小、误差不到1%

Distil-Whisper 是 Whisper 的精简版本,比 Whisper 更快、更小,且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术,包括低秩分解和知识蒸馏,以实现...

Read More
2023-12-21 talkingdev

STSSNet,增强型实时渲染项目

该项目介绍了时空超采样(STSS),这是一个显著改进实时渲染高分辨率、高帧率内容的框架。该项目已在GitHub上发布,用户可以从中获取源代码并进行使用。

Read More
2023-12-20 talkingdev

MicroAgents:具有自我编辑功能的智能代理

最近,GitHub上发布了一个名为Microagents的新项目,它是一种能够自我编辑其提示和Python代码的代理。这个项目旨在帮助开发人员更轻松地创建、测试和部署人工智能代理,而无需进行繁琐的手动编程。Microagents项目使...

Read More
  1. Prev Page
  2. 48
  3. 49
  4. 50
  5. Next Page