漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-21 talkingdev

多模态Agent攻击-我们能信任视觉语言模型吗

视觉启用的语言模型(VLMs)如GPT-4o和Gemini,能够赋予自主代理人完成诸如进行购物或编辑代码等任务的能力。然而,这项工作也突出了这些代理人易受到恶意攻击的脆弱性。在现实世界中,我们必须对这些具有视觉理解能...

Read More
2024-06-21 talkingdev

开源框架WebCanvas,实时评估Web Agent

WebCanvas是一个全新的框架,专门用于在动态的、实时的网络环境中评估自主Web代理Agent。该框架的出现,将为Web代理Agent的开发和应用带来革新。WebCanvas以其高度灵活和动态的特性,为Web代理提供了一个广阔的应用...

Read More
2024-06-20 talkingdev

Paramount开源,LLM Agent精度测量技术

近日,知名的开源平台GitHub上的Paramount项目公开了一项新的技术——LLMs(Large Language Models)的Agent精度测量。该技术旨在提升大型语言模型的代理精度,助力开发者更加准确地评估和优化模型性能。据了解,LLMs...

Read More
2024-06-20 talkingdev

OpenAI与Google五月公告的主要看点:先进的AI模型引领未来

OpenAI和Google已经推出了先进的AI模型,能够实现实时的多模式理解和响应,带来了AI助手和语音代理的创新。OpenAI的GPT-4o以其前代的两倍速度和一半成本引发了关注,而Google的Gemini 1.5 Flash实现了显著的延迟和成...

Read More
2024-06-19 talkingdev

Decagon筹集3500万美元A轮融资,构建人性化的AI Agent,a16z领投

Decagon正在为客户支持构建人性化的AI Agent。该公司近期从Accel获得了3000万美元的A轮融资,并从a16z获得了500万美元的种子轮融资。Decagon的产品为Eventbrite、Rippling、Webflow、BILT和Substack等公司提供全球支...

Read More
2024-06-19 talkingdev

开源本地代理Open Interpreter,无缝控制模型并全程离线运行

近期,开源的本地代理工具Open Interpreter刚刚完成了一次重大升级。据了解,此次升级让这款工具具备了无缝控制计算机的能力,而且可以全程离线、本地运行。这意味着用户无需连接互联网,就可以自由使用这款工具,极...

Read More
2024-06-03 talkingdev

Mora:挑战Sora的新一代视频生成模型开源

Mora是一款创新的视频生成模型,它利用多个视觉AI代理,旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统,这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...

Read More
2024-05-20 talkingdev

Agent开发的简单域名售卖网站garple.com

Garple是一个在线销售短小、易于发音的.com域名的网站,这些域名非常适合作为初创公司的名称。令人惊奇的是,该网站上所有的代码都是由一个AI编码代理完成的。这标志着人工智能在编程领域的应用已经步入了一个新的阶...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page