Anthropic自曝80%代码由AI编写后紧急喊停:估值9650亿的AI龙头为何呼吁全球暂停研发?

2026-06-12 · industry-analysis
⚡ TL;DR
2026年6月5日,估值9650亿美元的AI龙头Anthropic发布重磅博客《When AI builds itself》,自曝内部超80%代码已由Claude编写、工程师产出暴增8倍后,公开呼吁全球暂停前沿AI研发。创始科学家Jack Clark预测2028年底前AI实现递归自我改进的概率高达60%。本文深度拆解Anthropic报告中的全部数据、三种未来剧本和全球暂停协议的可行性。

引言:AI行业最赚钱的公司,突然说"请停下来"

2026年6月5日,一条消息震动了整个科技界:估值9650亿美元、刚刚超越OpenAI成为全球最有价值AI公司的Anthropic,在其官方博客上发布了一篇题为《When AI builds itself》(当AI开始自我构建)的长文,公开呼吁全球暂停前沿AI模型的研发

这不是环保组织或伦理学者的倡议,而是来自当前AI竞赛中跑得最快的选手。更让人脊背发凉的是支撑这个呼吁的数据:Anthropic内部超过80%的代码已由Claude编写,工程师人均产出暴增8倍,Claude Mythos在科研实验中展现了人类52倍的加速能力。

联合创始人Jack Clark在一个月前的伦敦演讲中给出了一个冰冷的数字:到2028年底,AI实现递归自我改进(Recursive Self-Improvement)的概率高达60%。这个概率,比抛硬币猜对正反面的可能性还要高出10个百分点。

一家估值万亿的AI公司在IPO前夜突然踩刹车,这究竟是真诚的警告,还是精心策划的商业策略?本文将从Anthropic报告中的每一组数据出发,拆解这场"AI龙头喊停风暴"的来龙去脉。


一、一组令人不安的数据:AI不是"辅助",而是"主导"

Anthropic研究员Marina Favaro和Jack Clark在博客中披露的内部数据,描绘了一条从"AI辅助人类"到"AI主导研发"的陡峭上升曲线。这组数据是理解Anthropic为何喊停的关键。

1.1 代码编写:80%已是AI的活儿

截至2026年5月,Anthropic合入代码库的代码中,超过80%由Claude撰写。作为对比,2025年2月Claude Code刚发布时,这个数字还停留在个位数。短短15个月,从"打打下手"变成了"包揽八成"。

一位Anthropic员工在接受内部调研时直言:"我已经有大约5个月没自己写过任何代码了。"这不是一个"AI辅助编程"的故事,而是一个"AI编程、人类审查"的新范式。更让人细思极恐的是,Anthropic承认代码审查也已经开始由Claude自己完成——Claude写代码、Claude审代码的闭环已经运转。

1.2 生产力:工程师产出暴增8倍

Anthropic追踪了典型工程师的每日代码合入量:

时间段产出水平关键事件
2021-2024年基准线(基本持平)AI辅助编程尚未规模化
2025年首次显著上扬Claude开始自主运行代码
2026年Q28倍于2024年Claude长时间自主工作,"第二次陡升"

Anthropic自己也承认,"代码行数肯定高估了真实生产力",于是他们在2026年3月对130名研究员做了调查。结果是:中位数受访者估计自己的产出是无AI时的4倍左右。即使按保守的4倍计算,这依然是工业革命以来任何技术都未曾实现的个人生产力跃升。

1.3 科研:Mythos加速52倍,人类被甩出数量级

Anthropic设计了一个实验来测试Claude的科研能力:给Claude一段训练小型AI模型的代码,要求在保证正确性的前提下优化运行速度。结果触目惊心:

作为人类对照基准,一位熟练的研究员需要4到8小时才能实现4倍加速。仅仅一年时间,Claude就从"超级有用"跃升到了超人水平——在目标明确的实验优化环节,人类已经被甩开了一个数量级。

1.4 研究判断力:AI开始比人类"更有远见"

更让Anthropic研究员紧张的是"研究品味"这个指标。他们设计了一个测试:让模型判断研究中"下一步该做什么"。

这意味着,在决定"研究应该往哪个方向走"这件事上,AI的判断力已经系统性地超越大多数人类研究员。人类仅存的比较优势——"研究品味"——正在以肉眼可见的速度被AI追平。


二、"When AI builds itself":递归自我改进的临界点

2.1 什么是递归自我改进?

Anthropic在博客中给出了一个清晰的定义:递归自我改进(Recursive Self-Improvement,RSI)是指AI系统能够自主设计、构建和训练自己的继任者,而无需人类在每一步都驱动这个过程

用更直白的话说:AI改进AI的速度,超过了人类改进AI的速度。一旦这个飞轮开始转动,它就会脱离人类的手,越转越快——而人类只能旁观。

2.2 为什么现在喊停?三道瓶颈正在逐一被突破

Anthropic用"Amdahl定律"的框架分析了递归自我改进的进度——就像计算机科学里加速某个组件会受到其他组件的限制一样,AI自进化也被三道瓶颈卡着:

    • 代码审查排队:人类审查速度跟不上Claude的代码生成速度。但现在已经出现了"Claude写+Claude审"的闭环。
    • 消化能力不足:新想法、新工具、模拟产出的量已经爆炸到公司无力全部消化的地步。但AI不存在"消化不过来"的问题。
    • 研究品味:这是人类仅存的比较优势——判断"哪些问题值得做"和"哪些结果可信"。但Mythos Preview的64%判断胜率表明,这道墙也快塌了。

Anthropic的结论是:这三道瓶颈正在同步被突破,而非逐个击破。当最后一道也倒下时,递归自我改进的飞轮就会自动启动。


三、Jack Clark的60%概率:2028年,AI可能不再需要人类

Anthropic联合创始人Jack Clark在上个月的伦敦演讲中抛出了一个让全场沉默的数字:到2028年底,AI实现递归自我改进的概率为60%

60%是什么概念?它比抛一枚硬币猜对正反面的概率(50%)高出10个百分点,比掷骰子掷出1的概率(16.7%)高出近4倍。这不是一个"也许可能"的含糊预测,而是一个经过内部数据校准的严肃估计。

更值得注意的是,这个预测来自一个能看到最前沿进展的人。Jack Clark不是坐在象牙塔里的理论家,他是Anthropic的联合创始人兼政策总监,每天接触的是Claude最新版本的内部测试数据。当他用"60%"这个数字时,背后是Mythos Preview在Project Glasswing中在全球关键系统中找出超过10,000个高危和严重级漏洞这样的真实案例。

还有一个数据不容忽视:2026年5月,Claude在"最开放任务"上的成功率达到了76%,6个月内暴涨了50个百分点。如果这个加速度持续下去,到2028年,成功率将逼近甚至超过100%的理论上限。


四、三种未来剧本:S曲线见顶 vs 复合加速 vs 完全自进化

Anthropic在博客中勾勒了AI发展的三种可能路径,并给出了自己基于内部数据的判断:

剧本一:S曲线见顶(Anthropic最不相信)

这个剧本认为AI的发展会像之前的技术浪潮一样遇到自然瓶颈——芯片制造、电网容量、供应链限制最终会拖慢AI的进步速度。趋势会自然平缓,无需人为干预。

Anthropic的驳斥:"我们衡量能力的每一条曲线都没有弯。"从代码生成到数学推理,从多模态理解到工具调用,Anthropic内部追踪的每一个能力维度都在持续陡峭上升。没有一条曲线出现了"见顶"的迹象。

剧本二:复合加速,人类掌舵(Anthropic认为最可能)

AI研发大幅自动化,但人类保持方向盘。100人的公司能干出10万人组织的活儿,但人类仍然设定目标、评估风险、做出最终决策。

这个剧本听起来很美好,但Anthropic在脚注中提醒:效率的另一面是权力集中。100人操控10万人级别的AI算力,意味着少数人有能力进行全民监控、大规模信息操纵——而这些能力不一定会被善意地使用。

剧本三:完全递归自我改进(Anthropic"没有好的直觉")

AI自己设计、训练、迭代继任者。进步速度只取决于算力供给。人类退居验证和监督角色——而且很快连验证都跟不上。

Anthropic对这个剧本的态度是罕见的坦诚:"我们对这个剧本没有好的直觉"。这句话翻译过来就是:如果走到第三步,连世界上最懂AI安全的人也不知道会发生什么。"罕见的失准行为可能复合放大,直至完全失控"——这是原话。


五、全球暂停协议:不是喊口号,是一份可操作的建议

Anthropic并非简单地喊一句"大家都别干了"。他们提出的是一份包含具体机制的建议:

5.1 核心原则:同时停、可验证

Anthropic强调,任何暂停必须是多家资源充足的前沿实验室,在多个国家,同意在相同条件下同时停止,且彼此可验证。如果只有谨慎的玩家放慢脚步,而不谨慎的玩家继续狂奔,那暂停不仅无效,反而会"把领先优势拱手送给最不谨慎的人"。

涉及的实验室包括OpenAI、Google、xAI、Meta等少数几家真正拥有前沿模型训练能力的公司。这不是针对中小AI创业公司或工具开发者的限制。

5.2 暂停的目的:让社会结构追上技术速度

Anthropic明确表示,暂停不是永久的,而是为了"让社会结构和对齐研究跟上技术进步的脚步"。具体来说:

5.3 现实障碍:IPO窗口期下的囚徒困境

Anthropic自己也承认这份建议面临巨大的现实阻力。三家主要的AI实验室都处于IPO窗口期,暂停研发将直接影响估值和融资计划。更关键的是,这是一场典型的囚徒困境——每个玩家都担心中止研发会让对手超越自己。

Anthropic在这个问题上的立场也充满了内部张力。就在呼吁暂停的一周前,公司刚刚提交了IPO机密文件,估值达到9650亿美元。2025年2月,他们大幅修改了"负责任扩展政策",放弃了"除非能保证安全措施充分,否则绝不训练AI系统"的核心承诺。首席科学官Jared Kaplan的解释是:"单方面停止训练模型而竞争对手继续推进,实际上对任何人都没有帮助。"

批评者——包括特朗普前顾问David Sacks——指责Anthropic在推行"监管俘获"策略:以负责任AI开发为名,行遏制竞争对手之实。在领导地位确立后设置规则门槛,让后来者无法追赶。


六、这场风暴对普通开发者和AI工具用户意味着什么?

抛开宏观叙事,Anthropic的喊停对于每天使用Cursor写代码、用ChatGPT做方案、靠GitHub Copilot提速的普通开发者来说,有几点直接影响值得关注:

6.1 AI编程工具的"军备竞赛"不会停,但方向可能会变

无论Anthropic的呼吁能否转化为实际行动,短时间内Claude CodeGitHub CopilotCursorTraeDevin AI等AI编程工具之间的竞争只会更激烈。但一个可能的转变是:安全能力(沙箱、权限控制、代码审计)会成为下一个差异化维度,而不是谁生成的代码更多。

6.2 "AI写代码,人类审查"的范式会加速普及

Anthropic的80%代码占比数据传递了一个清晰的信号:AI写代码已经不是未来时,而是现在进行时。对于普通开发者来说,核心技能正在从"写代码"转向"判断AI写的代码对不对、好不好、安不安全"。如果你还在抗拒AI编程工具,Anthropic的数据说明你正在被时代加速甩开。

6.3 安全工具的需求将爆发

Project Glasswing在几周内发现10,000+高危漏洞的数据说明了两件事:第一,AI确实可以帮我们发现巨大的安全隐患;第二,全球关键系统中存在的漏洞数量远超我们的想象。可以预见,CodeRabbit这类AI代码审查工具,以及各类AI安全审计工具的需求会迎来爆发式增长。

6.4 国内AI企业将获得"弯道超车"窗口

如果全球前沿AI研发真的减速(哪怕只是部分实验室的自愿放缓),对于DeepSeek通义千问Kimi阶跃星辰等国内AI企业来说,这将是一个缩小差距的战略窗口。但在Anthropic描述的"不可验证的单边减速等于自废武功"的逻辑下,国内企业大概率会继续按自己的节奏前进。


七、数据不会说谎,但解释数据的人会

回到最初的问题:Anthropic的喊停是真诚的警告,还是商业策略?

真相可能介于两者之间。数据本身是真实的:80%代码由AI编写、8倍生产力跃升、52倍科研加速——这些都不可能凭空编造。但对于同样的数据,不同的立场可以给出完全不同的解读。

乐观者会说:这证明了AI是人类的超级工具,8倍效率意味着8倍的经济增长潜力。

悲观者会说:如果80%代码已经是AI写的,那再过两年,人类在AI研发链条上的任何一个环节都将不再是必需品。

Anthropic自己的立场则充满了矛盾。他们在IPO前夜呼吁刹车,在修改负责任扩展政策后不到4个月又发出警告,在成为行业老大后突然开始讲安全——这些时间点的巧合让人很难不去质疑动机。

但有一点是确定的:递归自我改进的飞轮确实在加速旋转。无论Anthropic的动机是什么,他们公布的数据为全行业敲响了一记警钟——如果你还在把AI当成一个"高级代码补全工具",你看到的只是冰山浮出水面的十分之一。


结语:刹车还是油门,这不是一个人的选择

6月5日的这篇博客,与其说是一份"暂停倡议",不如说是一份"AI行业现状诊断报告"。Anthropic用自己内部的数据向全世界展示了AI正在以怎样的速度从"人类工具"变成"自主研发主体"。

60%的概率,2028年前AI实现自我进化。这个数字或许有争议,但争议本身就是Anthropic想要的效果——让世界开始讨论这个问题,而不是等到飞轮启动的那一天才措手不及

对于每个使用AI工具的普通人来说,这份报告的真正价值不是让你焦虑,而是让你清醒:AI的时代不是"即将到来",而是"已经到来"。你和AI的相处方式,决定了你在这个时代的位置——是坐在驾驶座上,还是被甩在后视镜里。

参考资料:Anthropic官方博客《When AI builds itself》、Fortune、CNN、TechCrunch等主流媒体的同步报道。


推荐阅读: