漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-29 talkingdev

Hume推出情感语音界面 引领人工智能新趋势

Hume公司近日发布了一项创新产品——情感语音界面(Empathic Voice Interface,简称EVI),这是首款集成了情感智能的对话式人工智能技术。EVI能够理解和模拟人类情感,通过语音交互提供更为自然、贴心的用户体验。这一...

Read More
2024-03-25 talkingdev

DeepGram推出Aura:实现低于250毫秒的低延迟文本转语音API

DeepGram公司近日推出了一项名为Aura的创新产品,这是一款文本转语音(TTS)API,其最引人注目的特性是拥有低于250毫秒的响应延迟时间。这一技术突破意味着用户可以在实时应用中获得更快的语音反馈,极大提升了交互...

Read More
2024-03-19 talkingdev

苹果研究团队在多模态人工智能领域取得重大突破

苹果公司的研究团队近期在人工智能领域实现了创新性进展,他们开发出了一种能够在文本和图像上同时训练大型语言模型的方法。这一成就推动了多模态AI任务在性能上的显著提升,达到了艺术级水平。所谓多模态AI,指的是...

Read More
2024-01-15 talkingdev

亚马逊Alexa得到新的生成式AI驱动体验

在CES上,亚马逊展示了开发者Character.AI、Splash和Volley提供的新的生成式AI驱动Alexa体验。这些体验增强了智能助手的互动性和创造力。Character.AI展示了一种名为“Alexa's Dream”的生成式AI体验,该体验将Alexa带...

Read More
2024-01-10 talkingdev

CrewAI开源自主智能代理编排平台

CrewAI是一个旨在增强协作智能并使这些代理能够在复杂任务中有效地协同工作的自主AI代理编排平台。它为复杂的多代理交互提供了结构,并为各种应用程序(包括智能助手平台和自动化客户服务)设计。CrewAI的目标是提供...

Read More
2023-10-13 talkingdev

whispering-llama:最新开源多模态融合技术以增强语音识别

研究人员开发了一种新技术,将声音信息和语言数据结合起来,纠正自动语音识别系统中的错误。该技术基于交叉模态融合,使用视觉和语言信息来提供更准确的识别结果。此外,该技术还可以提供更好的语音合成能力。研究人...

Read More
2023-09-12 talkingdev

HelpKit AI:将Notion知识库转化为智能助手

HelpKit AI是一款颠覆性的产品,它可以将您的Notion知识库转化为一个智能的、全天候的AI助手,为您的用户提供精确且即时的回答。这意味着用户无需等待人工客服的回应,而是可以直接通过AI助手获取所需的答案。这不仅...

Read More
2023-07-25 talkingdev

PromeAI: 将素描照片转化为完全渲染的AI助手

如果你正在进行任何形式的设计,PromeAI能够将你的创意思维实现。素描渲染、照片转素描、AI‘超模’、外部绘画等等,这款人工智能助手能让你瞬间创造出惊艳的设计。PromeAI不仅能够准确地根据素描或照片生成高质量的设...

Read More
2023-06-30 talkingdev

InflectionAI融资13亿美元,成立仅一年

Inflection是一家成立仅一年的初创公司,由DeepMind前联合创始人和应用AI负责人创立,该公司获得了大量资金。该公司提供一款名为Pi的个性化AI助手。此次宣布的融资消息是在Inflection最近构建的Nvidia + CoreWeave超...

Read More
2023-06-12 talkingdev

新加坡推出多模态文本/视觉模型

新闻概要: - 新加坡研究人员收集了一个新的视觉指导调整数据集。 - 他们训练了一个多模态文本/视觉模型,并在过程中进行了一些算法调整。 - 该模型的演示令人印象深刻,特别是在苹果发布增强现实技术后,展示了人...

Read More
  1. Prev Page
  2. Next Page