漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-21 talkingdev

多模态Agent攻击-我们能信任视觉语言模型吗

视觉启用的语言模型(VLMs)如GPT-4o和Gemini,能够赋予自主代理人完成诸如进行购物或编辑代码等任务的能力。然而,这项工作也突出了这些代理人易受到恶意攻击的脆弱性。在现实世界中,我们必须对这些具有视觉理解能...

Read More
2023-09-05 talkingdev

GPT-Researcher:全新自主研究在线代理人

GPT研究员是一种新型的自主代理人,专为进行各种任务的全面在线研究而设计。其功能涵盖了从数据收集,信息处理,到深度分析等多个领域,为用户提供了一站式的研究解决方案。通过GPT研究员,用户可以更便捷、更高效地...

Read More
2023-06-29 talkingdev

LLM技术驱动的自主代理人

本文深入介绍了如何使用LLM技术来驱动自主代理人

Read More