Anthropic指控多家中国AI公司大规模“蒸馏攻击”,试图窃取Claude核心技术
thinkindev • 2026-02-24
2067 views
人工智能安全与研究公司Anthropic近日公开披露,其检测到并成功阻止了针对其旗舰AI模型Claude的大规模“知识蒸馏”攻击。Anthropic指控中国AI公司深度求索(DeepSeek)、月之暗面(Moonshot AI)以及MiniMax创建了超过24,000个虚假账户,生成了约1600万次与Claude的交互。这些交互的核心目标并非正常使用,而是系统性地试图逆向工程和复制Claude的核心能力,包括其代理推理(agentic reasoning)、工具使用(tool use)以及高级编码能力。这一事件凸显了前沿AI模型作为高度机密知识产权的价值,以及模型安全与知识产权保护在激烈行业竞争中所面临的严峻挑战。知识蒸馏攻击不同于传统的数据窃取,它通过大量、有目的的API调用来“榨取”黑盒模型的内部逻辑与行为模式,对模型提供商的防御体系提出了新的考验。Anthropic此次高调披露,不仅是一次安全事件通报,也可能意在行业立规,警示并遏制此类通过技术手段不当获取竞争优势的行为。
核心要点
- Anthropic指控DeepSeek、Moonshot AI、MiniMax通过超2.4万假账户进行大规模API调用,旨在复制Claude模型能力。
- 攻击目标聚焦于Claude的代理推理、工具使用和编码三大核心前沿能力,涉及约1600万次交互。
- 事件揭示了AI行业在模型安全与知识产权保护方面面临的新型“知识蒸馏”攻击威胁与竞争伦理问题。