Anthropic 发了一篇博客,标题叫《When AI Builds Itself》(当 AI 开始构建自身),呼吁全球主要 AI 实验室考虑放慢甚至暂停前沿 AI 的开发。
呼吁的依据是一组来自 Anthropic 内部的数据:截至 2026 年 5 月,合并进 Anthropic 生产系统的代码中超过 80% 由 Claude 编写,而 2025 年 2 月 Claude Code 发布前这个比例还是个位数。工程师平均每天合并的代码量是 2024 年的 8 倍。
2026 年 4 月,Claude 在一次内部任务中独立完成了超过 800 项代码修正,将一类 API 错误减少了 1000 倍。外部基准也在印证这一趋势:METR 的测算显示,AI 能可靠完成的任务长度大约每四个月翻一倍。
Anthropic 的政策负责人 Jack Clark 在 BBC Newsnight 采访中说:「你需要有能力把脚从油门上移开,踩到刹车上去。」他还表示,Claude 在两年内有可能实现 100% 自主编写代码。
Anthropic 担心的核心场景叫「递归自我改进」(recursive self-improvement),即 AI 系统能够独立设计和开发自己的下一代版本,不再需要人类介入。博客明确说「我们还没有到那一步,递归自我改进也不是必然的」,但也警告这个时间点可能比大多数政府和机构准备好的时间来得更早。
Anthropic 提出的方案是:建立一个全球性的、可验证的协调机制,让多个国家的多家 AI 实验室能够同时暂停。它强调,如果只有一家公司停下来,竞争对手只会加速超越,所以单方面暂停没有意义。
但这个呼吁的时机引发了广泛质疑。
Anthropic 刚完成 650 亿美元的 H 轮融资,估值接近 9650 亿美元,年化收入已突破 470 亿美元。公司已秘密提交了 IPO 申请,估值可能超过 1 万亿美元。同时,Anthropic 的受限模型 Claude Mythos Preview 在 ML 训练代码上实现了 52 倍加速,但以网络安全为由不对公众开放,仅供少数受信任组织使用。
沃顿商学院教授 Ethan Mollick 的评价比较中立:「有一点自恋,有一些营销成分,也有很多关于 Anthropic 认为 AI 近期走向的真诚信念。」
点击图片查看原图