漫话开发者 - UWL.ME Mobile
Loading more...
漫话开发者 - UWL.ME Mobile

人工智能研究公司Perplexity近日开源了其最新研究成果“BrowseSafe”,这是一个专门为保护AI浏览器智能体(AI Browser Agents)而设计的实时内容检测模型与基准测试套件。在开放世界的网页环境中,AI智能体在执行网页浏览、信息提取等任务时,极易遭遇“提示注入”(Prompt Injection)攻击。攻击者通过在网页HTML中嵌入精心构造的恶意指令,可以劫持AI智能体的行为,导致其泄露敏感信息、执行非授权操作或产生有害输出。BrowseSafe的核心创新在于提供了一套分层的防御架构。其开源模型能够在不显著影响性能的前提下,实时扫描网页HTML内容,精准识别并过滤其中潜在的隐藏恶意指令。同时,配套的BrowseSafe-Bench基准测试套件为开发者提供了一个标准化的评估环境,用以量化不同AI智能体在面对各类提示注入攻击时的安全性与鲁棒性。这项研究标志着AI智能体安全从封闭、受控环境向开放、动态网络环境迈出了关键一步,为构建下一代安全、可靠的自动化AI助手奠定了重要的技术基础。

核心要点

  • BrowseSafe是Perplexity推出的开源实时检测模型与基准套件,旨在保护AI浏览器智能体。
  • 其核心功能是扫描网页HTML,识别并防御可能导致AI行为被劫持的“提示注入”攻击。
  • 该方案提供了分层防御和标准化评估基准,助力开发者在开放网络环境中构建更安全的AI智能体。

Read more >