多模态Agent攻击-我们能信任视觉语言模型吗

视觉启用的语言模型（VLMs）如GPT-4o和Gemini，能够赋予自主代理人完成诸如进行购物或编辑代码等任务的能力。然而，这项工作也突出了这些代理人易受到恶意攻击的脆弱性。在现实世界中，我们必须对这些具有视觉理解能力的语言模型保持警惕。这是因为，虽然他们在完成任务时表现出色，但是他们也可能被利用来进行恶意活动。因此，我们需要对这些模型进行深入的审计和持续的监控，以确保他们的安全和有效性。