漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-22 talkingdev

WhisperPlus,高质量语音转文字技术开源

近日,WhisperPlus正式发布。据悉,该开源项目采用了先进的语音转文字处理技术,能够实现高质量、高准确性的语音转文字功能。此外,该项目还支持多种语言和方言,可广泛应用于语音转写、智能客服等领域。WhisperPlus...

Read More
2023-12-22 talkingdev

谷歌公布850+人联合论文,阐述Gemini语言模型的研究成果

Google的Gemini语言模型项目已经发表了一篇850多位作者的论文。该论文详细阐述了Gemini语言模型的研究成果,但缺乏关键的架构和数据集细节。该论文还提供了有关归因和评估的详细信息。

Read More
2023-12-21 talkingdev

Distil Whisper:新的语音识别技术比 Whisper 更快、更小、误差不到1%

Distil-Whisper 是 Whisper 的精简版本,比 Whisper 更快、更小,且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术,包括低秩分解和知识蒸馏,以实现...

Read More
2023-12-21 talkingdev

VideoPoet:谷歌语言模型在视频创作中大放异彩

Google的VideoPoet是一种开创性的语言模型,它在处理文本到视频,视频风格化甚至视频到音频转换等多种任务方面具有独特的能力。这种方法通过将多种视频生成技术融合到一个模型中而脱颖而出。VideoPoet的革命性技术为...

Read More
2023-12-21 talkingdev

AI法律初创公司Harvey获得8000万美元B轮融资

AI法律初创公司Harvey AI利用OpenAI技术开发的一种法律服务,已经获得了另一轮融资,其估值超过7亿美元。该初创公司使用OpenAI构建基础模型,用于法律和法律实践应用。

Read More
2023-12-20 talkingdev

MicroAgents:具有自我编辑功能的智能代理

最近,GitHub上发布了一个名为Microagents的新项目,它是一种能够自我编辑其提示和Python代码的代理。这个项目旨在帮助开发人员更轻松地创建、测试和部署人工智能代理,而无需进行繁琐的手动编程。Microagents项目使...

Read More
2023-12-20 talkingdev

Google Vision开源权重分片,提升多节点系统训练效率

Google的Big Vision项目是一个研究和生产最先进的视觉系统的重要工具库。最近,他们添加了权重分片,使得在多节点系统上的训练更加容易。这个新功能可以将模型分成多个子模型,分别在不同的节点上进行训练,最后再将...

Read More
2023-12-20 talkingdev

Quint:结合了TLA理论基础和先进的类型检查和开发工具的规范语言

Quint是一种特别适用于分布式系统的规范语言。它结合了Temporal Logic of Actions (TLA)的强大理论基础和最先进的类型检查和开发工具。Quint具有简单和熟悉的语法、表达能力强的类型系统、新颖的效果系统、模拟器、...

Read More
  1. Prev Page
  2. 36
  3. 37
  4. 38
  5. Next Page