漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-20 talkingdev

impaction.ai推出新产品,为对话式人工智能产品提供分析服务

近日,impaction.ai公司推出了一款新产品,旨在为对话式人工智能(AI)产品提供分析服务。该产品采用最先进的技术,可以对许多不同类型的对话式AI产品进行分析,包括智能客服、语音助手和聊天机器人等。通过对产品的...

Read More
2023-10-20 talkingdev

DALLE-3研究论文: 合成语句生成器、改进的建模以及提升的测量方法

DALLE-3研究论文揭示了其惊人性能的主要成分,包括合成标题生成器、改进的潜在扩散建模以及提升的忠实度、风格和连贯性测量方法。DALLE-3是一种生成式模型,具有非常出色的生成图像的能力,其原理是通过大量的图像和...

Read More
2023-10-19 talkingdev

论文:Zipformer一种新的语音识别Transformer模型

这项研究介绍了Zipformer,一种用于自动语音识别(ASR)的改进Transformer模型,它更快、占用更少内存,而且比广泛使用的Conformer效果更好。Zipformer是一种新型的语音识别模型,它使用了一种全新的架构,能够更快...

Read More
2023-10-18 talkingdev

LLMs在场景图生成中的改进技术应用开源

本研究介绍了LLM4SGG弱监督场景图生成方法,该方法利用大型语言模型的能力,从图像标题中更好地提取和对齐关系,解决了图像标题中捕获详细关系和利用所有可用信息的挑战。

Read More
2023-10-18 talkingdev

HuggingFace diffusers开源轻量快速推理引擎

近日,HuggingFace diffusers轻量快速推理引擎在GitHub上线。该引擎通过许多小改进,实现了大幅提升推理速度的目标,声称每秒可达60步,比原来的23步快了许多。该引擎在自然语言处理任务中表现优异,受到了许多开发...

Read More
2023-10-17 talkingdev

增强地球观测工具开源

一项新的研究介绍了一种结合不同时间的数字地形模型(DSM)数据和航拍图像的方法,以改进超越2D视角的变化检测。

Read More
2023-10-16 talkingdev

minidalle3,提高LLMs的文本到图像生成技术

研究人员正在改进我们与文本到图像模型的交互方式,例如Midjourney和Stable Diffusion,这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”,使人们可以自然地与大型语言模型进行交互,以获得更...

Read More
2023-10-13 talkingdev

AppManager:面向初创企业的AI Agent

AppManager是一款专为初创企业打造的人工智能IT代理。它可以自动管理和监控企业的应用程序,以确保它们始终保持最新状态。AppManager利用机器学习技术,不断学习和改进,以提高企业的IT效率。此外,AppManager还可以...

Read More
  1. Prev Page
  2. 25
  3. 26
  4. 27
  5. Next Page