漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-15 talkingdev

Google I/O 2024新品发布:Gemini Flash、Veo视频生成、Imagen 3及最新助手Project Astra亮相

在2024年的Google I/O开发者大会上,Google发布了众多新功能,包括Gemini Flash、Veo视频生成、Imagen 3及其最新助手Project Astra。整体而言,这些改进数量惊人,包括扩大到2m的令牌上下文长度,大幅降低的模型价格...

Read More
2024-05-14 talkingdev

苹果正在敲定与OpenAI的协议,将ChatGPT特性引入iPhone

苹果公司正在与OpenAI接近达成一项协议,计划将ChatGPT技术整合到iPhone中,可能会在即将推出的iOS 18版本中作为其AI增强功能的一部分。ChatGPT是一款深度学习模型,可以生成人类的语言,此举将极大地提升iPhone的AI...

Read More
2024-05-06 talkingdev

Spider模型:革新性模型助力理解上下文相关概念

Spider是一个新型的统一模型,旨在增强对上下文依赖(CD)概念的理解,如伪装物体和医疗病变等。这些概念在很大程度上依赖于视觉背景。这个模型的独特性在于,它能够理解并应对由视觉环境变化引起的复杂情况。蜘蛛模...

Read More
2024-05-03 talkingdev

论文:全频动态卷积,提升声音事件检测的新方法

全频动态卷积(FFDConv)是一种新型的增强2D卷积用于声音事件检测的方法。通过为每个频段生成独特的频率内核,FFDConv能够提高检测声音事件的准确性,特别是在频率特性方面。声音事件检测是一个复杂的任务,因为它涉...

Read More
2024-05-03 talkingdev

苹果CEO Tim Cook将在iPad发布会上演示新的AI功能

据预期,苹果首席执行官Tim Cook将在下周的“Let Loose”活动中预示新的人工智能特性,并在六月的全球开发者大会(WWDC)上公布更多细节。新的iPad Pro模型可能会配备M4芯片,这意味着苹果即将推出的产品可能具有先进的...

Read More
2024-05-02 talkingdev

KAN:科尔莫戈洛夫-阿诺德Kolmogorov-Arnold网络的研究进展

如今,多层感知器在人工智能领域得到了广泛的应用,包括在Transformer的关注层之间。然而,它们使用的是固定的激活函数。最新研究论文建议在边缘使用学习的激活函数,利用科尔莫戈洛夫-阿诺德表示法(函数可以由更简...

Read More
2024-05-01 talkingdev

FlowTestAI-全球首个GenAI开源集成开发环境

FlowTestAI 是全球首个由GenAI驱动的开源集成开发环境(IDE),专为设计、可视化和管理API优先的工作流程而设计。这是一个技术的重大突破,它将AI技术与IDE结合,大大提高了开发者在构建和管理API工作流程的效率。Fl...

Read More
2024-04-30 talkingdev

GitHub发布新项目Copilot Workspace,让语言模型帮助完成功能和修复错误

GitHub近日宣布启动一个新项目Copilot Workspace,其主要目标是允许语言模型以较为自主的方式完成特性开发和错误修复。该项目将为开发者提供更多便利,提高开发效率,同时也为人工智能在软件开发领域的应用开启了新...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page