漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-25 talkingdev

谷歌AI产品泄密:多模态Gemini和革命性应用原型设计功能Stubbs

谷歌将用多模态AI模型Gemini取代PaLM 2,并将其引入Makersuite,提供图像和文本识别功能。该公司还拥有一个名为Stubbs的隐藏工具,使用户可以构建和启动AI生成的应用原型。Makersuite将很快完全支持语言翻译。

Read More
2023-10-25 talkingdev

艺术家的武器!数据污染工具让艺术家对抗生成式AI

芝加哥大学的研究人员开发了一种工具,让艺术家可以给他们的艺术作品添加不可见的变化,这会导致AI模型训练失败。这个工具旨在防止AI公司未经许可使用艺术家的作品。这个叫Nightshade的工具将被集成到Glaze中,Glaze...

Read More
2023-10-24 talkingdev

SALMONN:AI模型能够理解声音世界

本文介绍了SALMONN,这是一种独特的AI模型,它将文本理解与处理各种音频输入(从语音到音乐)的能力相结合。 SALMONN不仅在训练过的音频任务(如语音识别)中表现出色,而且展示了令人印象深刻的新技能,例如将语音...

Read More
2023-10-23 talkingdev

HuggingFace Hub推出开源模型以提取结构化数据

企业中使用AI模型的主要用途之一是从非结构化文本中提取结构化数据,如JSON或CSV。目前主要使用gpt-3.5-turbo的函数调用来完成此任务。GoLLIE通常表现更好,可以更加自信地运行敏感数据。

Read More
2023-10-19 talkingdev

全球最大的AI模型透明度有限,Stanford HAI发布透明度指数报告

斯坦福人工智能与人类中心研究所(Stanford HAI)最新发布的“基础模型透明度指数”显示,主要的AI基础模型开发者在社会影响方面提供的信息不足。虽然Meta的Llama 2在透明度方面得分最高,为54%,其次是BloomZ和OpenAI...

Read More
2023-10-17 talkingdev

人工通用智能已经存在

尽管如今的AI模型并不完美,但仍有很大可能最终被认定为人工通用智能的首批真正例子。人工智能技术正在飞速发展,从语音识别到图像识别,再到自动驾驶和机器人等领域,都有了巨大的进步。但是,现有的AI技术仍然存在...

Read More
2023-10-17 talkingdev

Insanely Fast Whisper: 使用OpenAI模型,300分钟音频转录不到10分钟

Insanely Fast Whisper是一个使用OpenAI的Whisper Large v2模型的音频转录工具,它可以在不到10分钟的时间内转录300分钟的音频。该工具快速且易于使用,同时可提供基准测试结果。

Read More
2023-10-16 talkingdev

OpenAI发布更新,提高AI开发效率

OpenAI计划在其开发人员工具中引入诸如内存存储和先进的视觉功能等更新,以显著降低应用程序成本,并促进各个领域的创新。 OpenAI的目标是使AI开发更加高效和可靠,以实现AI技术的广泛应用。随着这些新功能的引入,...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page