每道只花几百美元!谷歌DeepMind AlphaProof 攻克数十年未解数学难题
thinkindev • 2026-05-26
1281 views
谷歌DeepMind团队推出新系统AlphaProof Nexus,在未依赖公开发表或训练集中可见的标准解法的情况下,自主解决了353个公开埃尔德什(Erdős)问题中的9道,其中有两道难题甚至困扰了数学界56年之久。值得一提的是,每道题的推理成本仅需几百美元,标志着AI在数学推理领域实现了重大经济性和效率突破。不同于OpenAI等公司使用自然语言模型的方式,AlphaProof Nexus系统地利用了Lean形式化验证编译器的自动检查能力,确保每步推理均被精确验证。不过虽然首次展示出令人惊叹的解题能力,系统的整体成功率目前仅2.5%,距离全面自主数学证明仍有巨大提升空间。
核心要点
- DeepMind AlphaProof Nexus自主解决了9道数学难题,每道推理成本仅几百美元。
- 系统利用Lean编译器自动验证每步数学证明,完全不同于传统自然语言模型方法。
- 当前成功率仅为2.5%,尽管如此在解决数学界长达56年的未解问题上实现突破。