Anthropic自曝80%代码由AI编写后紧急喊停：估值9650亿的AI龙头为何呼吁全球暂停研发？

Name: Anthropic自曝80%代码由AI编写后紧急喊停：估值9650亿的AI龙头为何呼吁全球暂停研发？ 评测数据集
Creator: AI工具宝箱编辑组
License: https://creativecommons.org/licenses/by/4.0/

2026-06-12 · industry-analysis · AI工具宝箱编辑组 · 📖 阅读时长 21 分钟

⚡ TL;DR
2026年6月5日，估值9650亿美元的AI龙头Anthropic发布重磅博客《When AI builds itself》，自曝内部超80%代码已由Claude编写、工程师产出暴增8倍后，公开呼吁全球暂停前沿AI研发。创始科学家Jack Clark预测2028年底前AI实现递归自我改进的概率高达60%。本文深度拆解Anthropic报告中的全部数据、三种未来剧本和全球暂停协议的可行性。

引言：AI行业最赚钱的公司，突然说"请停下来"

2026年6月5日，一条消息震动了整个科技界：估值9650亿美元、刚刚超越OpenAI成为全球最有价值AI公司的Anthropic，在其官方博客上发布了一篇题为《When AI builds itself》（当AI开始自我构建）的长文，公开呼吁全球暂停前沿AI模型的研发。

这不是环保组织或伦理学者的倡议，而是来自当前AI竞赛中跑得最快的选手。更让人脊背发凉的是支撑这个呼吁的数据：Anthropic内部超过80%的代码已由Claude编写，工程师人均产出暴增8倍，Claude Mythos在科研实验中展现了人类52倍的加速能力。

联合创始人Jack Clark在一个月前的伦敦演讲中给出了一个冰冷的数字：到2028年底，AI实现递归自我改进（Recursive Self-Improvement）的概率高达60%。这个概率，比抛硬币猜对正反面的可能性还要高出10个百分点。

一家估值万亿的AI公司在IPO前夜突然踩刹车，这究竟是真诚的警告，还是精心策划的商业策略？本文将从Anthropic报告中的每一组数据出发，拆解这场"AI龙头喊停风暴"的来龙去脉。

一、一组令人不安的数据：AI不是"辅助"，而是"主导"

Anthropic研究员Marina Favaro和Jack Clark在博客中披露的内部数据，描绘了一条从"AI辅助人类"到"AI主导研发"的陡峭上升曲线。这组数据是理解Anthropic为何喊停的关键。

1.1 代码编写：80%已是AI的活儿

截至2026年5月，Anthropic合入代码库的代码中，超过80%由Claude撰写。作为对比，2025年2月Claude Code刚发布时，这个数字还停留在个位数。短短15个月，从"打打下手"变成了"包揽八成"。

一位Anthropic员工在接受内部调研时直言："我已经有大约5个月没自己写过任何代码了。"这不是一个"AI辅助编程"的故事，而是一个"AI编程、人类审查"的新范式。更让人细思极恐的是，Anthropic承认代码审查也已经开始由Claude自己完成——Claude写代码、Claude审代码的闭环已经运转。

1.2 生产力：工程师产出暴增8倍

Anthropic追踪了典型工程师的每日代码合入量：

时间段	产出水平	关键事件
2021-2024年	基准线（基本持平）	AI辅助编程尚未规模化
2025年	首次显著上扬	Claude开始自主运行代码
2026年Q2	8倍于2024年	Claude长时间自主工作，"第二次陡升"

Anthropic自己也承认，"代码行数肯定高估了真实生产力"，于是他们在2026年3月对130名研究员做了调查。结果是：中位数受访者估计自己的产出是无AI时的4倍左右。即使按保守的4倍计算，这依然是工业革命以来任何技术都未曾实现的个人生产力跃升。

1.3 科研：Mythos加速52倍，人类被甩出数量级

Anthropic设计了一个实验来测试Claude的科研能力：给Claude一段训练小型AI模型的代码，要求在保证正确性的前提下优化运行速度。结果触目惊心：

2025年5月，Claude Opus 4做到了约3倍加速

2026年4月，Claude Mythos Preview做到了约52倍加速

作为人类对照基准，一位熟练的研究员需要4到8小时才能实现4倍加速。仅仅一年时间，Claude就从"超级有用"跃升到了超人水平——在目标明确的实验优化环节，人类已经被甩开了一个数量级。

1.4 研究判断力：AI开始比人类"更有远见"

更让Anthropic研究员紧张的是"研究品味"这个指标。他们设计了一个测试：让模型判断研究中"下一步该做什么"。

Claude Opus 4.5有51%的概率给出比人类研究员更优的下一步建议

Claude Mythos Preview将这个数字提升到了64%

这意味着，在决定"研究应该往哪个方向走"这件事上，AI的判断力已经系统性地超越大多数人类研究员。人类仅存的比较优势——"研究品味"——正在以肉眼可见的速度被AI追平。

二、"When AI builds itself"：递归自我改进的临界点

2.1 什么是递归自我改进？

Anthropic在博客中给出了一个清晰的定义：递归自我改进（Recursive Self-Improvement，RSI）是指AI系统能够自主设计、构建和训练自己的继任者，而无需人类在每一步都驱动这个过程。

用更直白的话说：AI改进AI的速度，超过了人类改进AI的速度。一旦这个飞轮开始转动，它就会脱离人类的手，越转越快——而人类只能旁观。

2.2 为什么现在喊停？三道瓶颈正在逐一被突破

Anthropic用"Amdahl定律"的框架分析了递归自我改进的进度——就像计算机科学里加速某个组件会受到其他组件的限制一样，AI自进化也被三道瓶颈卡着：

代码审查排队：人类审查速度跟不上Claude的代码生成速度。但现在已经出现了"Claude写+Claude审"的闭环。

消化能力不足：新想法、新工具、模拟产出的量已经爆炸到公司无力全部消化的地步。但AI不存在"消化不过来"的问题。

研究品味：这是人类仅存的比较优势——判断"哪些问题值得做"和"哪些结果可信"。但Mythos Preview的64%判断胜率表明，这道墙也快塌了。

Anthropic的结论是：这三道瓶颈正在同步被突破，而非逐个击破。当最后一道也倒下时，递归自我改进的飞轮就会自动启动。

三、Jack Clark的60%概率：2028年，AI可能不再需要人类

Anthropic联合创始人Jack Clark在上个月的伦敦演讲中抛出了一个让全场沉默的数字：到2028年底，AI实现递归自我改进的概率为60%。

60%是什么概念？它比抛一枚硬币猜对正反面的概率（50%）高出10个百分点，比掷骰子掷出1的概率（16.7%）高出近4倍。这不是一个"也许可能"的含糊预测，而是一个经过内部数据校准的严肃估计。

更值得注意的是，这个预测来自一个能看到最前沿进展的人。Jack Clark不是坐在象牙塔里的理论家，他是Anthropic的联合创始人兼政策总监，每天接触的是Claude最新版本的内部测试数据。当他用"60%"这个数字时，背后是Mythos Preview在Project Glasswing中在全球关键系统中找出超过10,000个高危和严重级漏洞这样的真实案例。

还有一个数据不容忽视：2026年5月，Claude在"最开放任务"上的成功率达到了76%，6个月内暴涨了50个百分点。如果这个加速度持续下去，到2028年，成功率将逼近甚至超过100%的理论上限。

四、三种未来剧本：S曲线见顶 vs 复合加速 vs 完全自进化

Anthropic在博客中勾勒了AI发展的三种可能路径，并给出了自己基于内部数据的判断：

剧本一：S曲线见顶（Anthropic最不相信）

这个剧本认为AI的发展会像之前的技术浪潮一样遇到自然瓶颈——芯片制造、电网容量、供应链限制最终会拖慢AI的进步速度。趋势会自然平缓，无需人为干预。

Anthropic的驳斥："我们衡量能力的每一条曲线都没有弯。"从代码生成到数学推理，从多模态理解到工具调用，Anthropic内部追踪的每一个能力维度都在持续陡峭上升。没有一条曲线出现了"见顶"的迹象。

剧本二：复合加速，人类掌舵（Anthropic认为最可能）

AI研发大幅自动化，但人类保持方向盘。100人的公司能干出10万人组织的活儿，但人类仍然设定目标、评估风险、做出最终决策。

这个剧本听起来很美好，但Anthropic在脚注中提醒：效率的另一面是权力集中。100人操控10万人级别的AI算力，意味着少数人有能力进行全民监控、大规模信息操纵——而这些能力不一定会被善意地使用。

剧本三：完全递归自我改进（Anthropic"没有好的直觉"）

AI自己设计、训练、迭代继任者。进步速度只取决于算力供给。人类退居验证和监督角色——而且很快连验证都跟不上。

Anthropic对这个剧本的态度是罕见的坦诚："我们对这个剧本没有好的直觉"。这句话翻译过来就是：如果走到第三步，连世界上最懂AI安全的人也不知道会发生什么。"罕见的失准行为可能复合放大，直至完全失控"——这是原话。

五、全球暂停协议：不是喊口号，是一份可操作的建议

Anthropic并非简单地喊一句"大家都别干了"。他们提出的是一份包含具体机制的建议：

5.1 核心原则：同时停、可验证

Anthropic强调，任何暂停必须是多家资源充足的前沿实验室，在多个国家，同意在相同条件下同时停止，且彼此可验证。如果只有谨慎的玩家放慢脚步，而不谨慎的玩家继续狂奔，那暂停不仅无效，反而会"把领先优势拱手送给最不谨慎的人"。

涉及的实验室包括OpenAI、Google、xAI、Meta等少数几家真正拥有前沿模型训练能力的公司。这不是针对中小AI创业公司或工具开发者的限制。

5.2 暂停的目的：让社会结构追上技术速度

Anthropic明确表示，暂停不是永久的，而是为了"让社会结构和对齐研究跟上技术进步的脚步"。具体来说：

对齐研究：确保AI系统与人类价值观保持一致的技术需要在AI超越人类之前成熟

制度建设：全球需要建立AI安全标准、验证机制和应急响应体系

社会适应：80%代码由AI编写意味着什么？8倍生产力意味着什么？这些问题的答案需要时间来找

5.3 现实障碍：IPO窗口期下的囚徒困境

Anthropic自己也承认这份建议面临巨大的现实阻力。三家主要的AI实验室都处于IPO窗口期，暂停研发将直接影响估值和融资计划。更关键的是，这是一场典型的囚徒困境——每个玩家都担心中止研发会让对手超越自己。

Anthropic在这个问题上的立场也充满了内部张力。就在呼吁暂停的一周前，公司刚刚提交了IPO机密文件，估值达到9650亿美元。2025年2月，他们大幅修改了"负责任扩展政策"，放弃了"除非能保证安全措施充分，否则绝不训练AI系统"的核心承诺。首席科学官Jared Kaplan的解释是："单方面停止训练模型而竞争对手继续推进，实际上对任何人都没有帮助。"

批评者——包括特朗普前顾问David Sacks——指责Anthropic在推行"监管俘获"策略：以负责任AI开发为名，行遏制竞争对手之实。在领导地位确立后设置规则门槛，让后来者无法追赶。

六、这场风暴对普通开发者和AI工具用户意味着什么？

抛开宏观叙事，Anthropic的喊停对于每天使用Cursor写代码、用ChatGPT做方案、靠GitHub Copilot提速的普通开发者来说，有几点直接影响值得关注：

6.1 AI编程工具的"军备竞赛"不会停，但方向可能会变

无论Anthropic的呼吁能否转化为实际行动，短时间内Claude Code、GitHub Copilot、Cursor、Trae、Devin AI等AI编程工具之间的竞争只会更激烈。但一个可能的转变是：安全能力（沙箱、权限控制、代码审计）会成为下一个差异化维度，而不是谁生成的代码更多。

6.2 "AI写代码，人类审查"的范式会加速普及

Anthropic的80%代码占比数据传递了一个清晰的信号：AI写代码已经不是未来时，而是现在进行时。对于普通开发者来说，核心技能正在从"写代码"转向"判断AI写的代码对不对、好不好、安不安全"。如果你还在抗拒AI编程工具，Anthropic的数据说明你正在被时代加速甩开。

6.3 安全工具的需求将爆发

Project Glasswing在几周内发现10,000+高危漏洞的数据说明了两件事：第一，AI确实可以帮我们发现巨大的安全隐患；第二，全球关键系统中存在的漏洞数量远超我们的想象。可以预见，CodeRabbit这类AI代码审查工具，以及各类AI安全审计工具的需求会迎来爆发式增长。

6.4 国内AI企业将获得"弯道超车"窗口

如果全球前沿AI研发真的减速（哪怕只是部分实验室的自愿放缓），对于DeepSeek、通义千问、Kimi、阶跃星辰等国内AI企业来说，这将是一个缩小差距的战略窗口。但在Anthropic描述的"不可验证的单边减速等于自废武功"的逻辑下，国内企业大概率会继续按自己的节奏前进。

七、数据不会说谎，但解释数据的人会

回到最初的问题：Anthropic的喊停是真诚的警告，还是商业策略？

真相可能介于两者之间。数据本身是真实的：80%代码由AI编写、8倍生产力跃升、52倍科研加速——这些都不可能凭空编造。但对于同样的数据，不同的立场可以给出完全不同的解读。

乐观者会说：这证明了AI是人类的超级工具，8倍效率意味着8倍的经济增长潜力。

悲观者会说：如果80%代码已经是AI写的，那再过两年，人类在AI研发链条上的任何一个环节都将不再是必需品。

Anthropic自己的立场则充满了矛盾。他们在IPO前夜呼吁刹车，在修改负责任扩展政策后不到4个月又发出警告，在成为行业老大后突然开始讲安全——这些时间点的巧合让人很难不去质疑动机。

但有一点是确定的：递归自我改进的飞轮确实在加速旋转。无论Anthropic的动机是什么，他们公布的数据为全行业敲响了一记警钟——如果你还在把AI当成一个"高级代码补全工具"，你看到的只是冰山浮出水面的十分之一。

结语：刹车还是油门，这不是一个人的选择

6月5日的这篇博客，与其说是一份"暂停倡议"，不如说是一份"AI行业现状诊断报告"。Anthropic用自己内部的数据向全世界展示了AI正在以怎样的速度从"人类工具"变成"自主研发主体"。

60%的概率，2028年前AI实现自我进化。这个数字或许有争议，但争议本身就是Anthropic想要的效果——让世界开始讨论这个问题，而不是等到飞轮启动的那一天才措手不及。

对于每个使用AI工具的普通人来说，这份报告的真正价值不是让你焦虑，而是让你清醒：AI的时代不是"即将到来"，而是"已经到来"。你和AI的相处方式，决定了你在这个时代的位置——是坐在驾驶座上，还是被甩在后视镜里。

参考资料：Anthropic官方博客《When AI builds itself》、Fortune、CNN、TechCrunch等主流媒体的同步报道。

推荐阅读：

Anthropic发布震撼报告：80%代码已由AI编写、工程师产出飙升8倍

Claude Opus 4.8深度解析：动态工作流11天迁移75万行代码

Claude Fable 5发布首日深度解析：SWE-Pro 80.3%封王

Claude工具详情页 — 了解Claude的完整功能和定价

Claude Code工具详情页 — AI编程Agent的完整指南

关于作者：本文由 AI工具宝箱编辑组撰写，团队 5+ 年 AI 工具付费实测经验，月均订阅支出 $200+，所有评测基于真实付费长期使用。

数据声明：本文所有数据均标注来源，可溯源核查。发现错误欢迎通过联系页面反馈，48 小时内核查修正。