漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-03 talkingdev

开源软件工程Agent与Devin性能匹敌

一款名为SWE-agent的开源软件代理在软件工程(SWE)基准测试中取得了12%的成功率,覆盖率达到100%。该代理利用GPT-4技术辅助编写软件并解决PRs(Pull Requests)。此代理的出现,不仅展示了人工智能在软件开发领域的潜...

Read More
2024-03-27 talkingdev

Codel:全自动化AIAgent,通过终端、浏览器和编辑器执行复杂任务

近期,一个名为Codel的GitHub项目引起了广泛关注。该项目旨在打造一个完全自主的AI代理,能够通过终端、浏览器和编辑器执行各种复杂任务和项目。Codel的出现标志着人工智能在自动化领域迈出了重要一步。通过这个AI代...

Read More
2024-03-27 talkingdev

AI领域的新星:Adept如何改变游戏规则

在这篇访谈中,我们深入探讨了David Luan的职业历程,他曾是OpenAI的早期员工、Google大型语言模型项目的领导者之一,以及Google Brain的共同领导。Luan也是Adept的创始人,该公司是AI代理领域的佼佼者。他分享了在...

Read More
2024-03-20 talkingdev

LlamaGym:在线强化学习优化大模型Agent

近日,GitHub上出现了一个新的项目LlamaGym,该项目专注于通过在线强化学习方法对大型语言模型(LLM)代理进行微调。大型语言模型在近年来取得了显著的进展,但如何进一步提升其性能,尤其是在特定任务上的表现,成...

Read More
2024-03-20 talkingdev

MineDreamer:AI在Minecraft世界的指令执行Agent

MineDreamer是一款AI代理,它通过结合先进的语言和视觉模型,擅长在Minecraft世界中执行复杂的指令。这一创新技术使得AI能够更好地理解玩家的意图,并在游戏中实现精准的操作。MineDreamer的成功不仅仅是在执行指令...

Read More
2024-03-15 talkingdev

Assort Health获得350万美元融资,将扩大面向医疗呼叫中心的第一代AI生成技术

Assort Health宣布获得350万美元的融资,以扩大其专门为医疗呼叫中心设计的生成式人工智能解决方案。该解决方案将利用AI生成呼叫中心代理人所需的所有内容。Assort Health表示,这将有助于医疗呼叫中心提高效率和质...

Read More
2024-03-15 talkingdev

论文:探索LLMs的安全性

最近的一项研究中,研究人员利用名为'Evil Geniuses'的虚拟团队测试了LLMs的安全性。他们发现这些人工智能代理对恶意攻击的鲁棒性较差,提供更复杂的回复,使不当回复更难以检测。

Read More
2024-03-14 talkingdev

谷歌发布SIMA,可在3D游戏中遵循自然语言指令

谷歌DeepMind的SIMA是一个通用的AI代理,可在各种电子游戏环境中遵循自然语言指令。它标志着将AI系统变得更加多才多艺、可指导的转变。此前,AI系统只能在特定的环境中工作,现在SIMA可以在多种环境下工作,这是一项...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page