讽刺:Anthropic求监管,第一个被监管“反噬”

2026年06月16日,17时53分10秒 科技新知 阅读 3 views 次

文 | 融中财经

从laude Fable 5发布到到暂停服务仅72个小时;从“求监管”到“被封杀”,仅48小时,

6月9日,Anthropic发布史上最强模型Claude Fable 5。6月10日,CEO达里奥·阿莫迪(DarioAmodei)发表万字长文,恳求政府建立强制性AI监管——“再不监管,就来不及了。”6月12日,监管真的来了。美国商务部以国家安全为由下达出口管制令:Fable 5全球禁用,所有外国公民包括Anthropic自己的外籍工程师一律不得接触。

这是AI行业第一次出现模型因安全事故而触发国家级管制行动的案例,而制造这个模型的Anthropic,恰恰是以制定“AI安全宪法”闻名的大模型公司。

阿莫迪在那篇万字长文中写道:AI正以指数速度向前狂奔,而人类的政治机器,还停留在工业时代的节奏。

但阿莫迪并非孤例。

就在几天前,彼时Fable 5尚未发布、出口管制令尚未降临,Anthropic联合创始人Jack Clark与内部研究机构负责人Marina Favaro,已在官方博客上联名发表了一篇文章,标题只有五个单词,却像一颗炸弹投入AI圈:《When AI Builds Itself》(当AI开始建造自己)。

再往前追溯,这条“恐惧链”早已延伸至整个行业:OpenAI CEO Sam Altman 2025年在参议院听证会上主动请求国会监管AI;图灵奖得主Geoffrey Hinton从Google离职后逢人便讲AI有多危险;另一位图灵奖得主Yoshua Bengio拉起国际团队,编纂了数百页的AI安全报告;Elon Musk 2023年在“暂停巨型AI实验”公开信上签了名,后来自己建了xAI,一边造模型,一边喊监管。

这群人手里握着全球最强的模型、最多的算力、最高的估值。他们造出了这个时代最厉害的技术,然后转身对政府说了同一句话:你得管住我们。

当你的对手、同行、同行挖走的人、你尊重的研究者都在说同一件事,“他们在搞营销”这个解释就撑不住了。真正的问题是:这群最不该怕AI的人,到底看见了什么?为什么AI最强的人,开始最担心AI?

四年跨越式迭代,AI已实现自我进化

要理解CEO们的焦虑,首先要看一组数字。

四年前,也就是2022年前后,最先进的AI模型“几乎写不出一行连贯的代码”。而到了2026年6月,AI系统“已经在为各大AI公司撰写大部分代码”。

这不是夸张。根据Anthropic在2026年6月报告中披露的数据:截至2026年5月,Anthropic合并到其生产代码库(Production Codebase)中的所有代码中,竟然有超过80%是由Claude自主编写完成的。这一数据在2025年2月之前,还仅仅只是徘徊在“低个位数”。

讽刺:Anthropic求监管,第一个被监管“反噬”

图片来源:Anthropic官方博客文章《When AI Builds Itself》

更让人不安的趋势是:AI能力增长的速度本身,还在加速。Anthropic追踪的一项核心指标“AI能独立稳定完成的任务时长”,其翻倍周期在持续缩短,从早期的每7个月翻一番,加速到现在的约每4个月翻一番。

按照这个速度外推,2026年内,需要熟练工程师数天完成的任务可能落入AI能力范围;2027年,AI系统可能处理需人类花数周完成的任务。

在一项代码优化实验中,这个加速趋势被量化得触目惊心:2025年5月,Claude Opus 4平均能将一段代码的运行速度提升约3倍;到2026年4月,Claude Mythos预览版已经能做到52倍的加速。而一个熟练的人类研究员,需要4到8小时才能做到4倍。

如果把时间轴拉长,会更直观。图灵奖得主Yoshua Bengio领衔的《2026年国际人工智能安全报告》指出,在“人类终极考试”一个涵盖100多个学科、2500多道题目的超难测试中,AI的得分率从2024年初的不足5%,一路攀升至2025年中的26%。在国际数学奥林匹克竞赛中,多个AI系统在2025年7月已经拿到金牌水平,6题中答对5题。

讽刺:Anthropic求监管,第一个被监管“反噬”

(图说:各种通用人工智能系统在人类终极考试中的表现及考试示例题。左:人工智能系统随着时间的进步,显示准确性随时间提升。右:数据集中一个化学问题的例子。来源:Scale AI,2025年。)

阿莫迪把这种速度差比作一枚指数级加速的火箭。他说Scaling Laws(规模定律)已经跑了十几年,规律很清楚:只要算力继续加,AI的认知能力就继续涨。如果这个趋势再跑一两年,就会出现他说的“Powerful AI”(高阶AI),即“一座数据中心内,汇聚着成千上万天才”的形态。

问题是,人类的制度,准备好迎接一座“天才数据中心”了吗?

技术狂奔不止,监管落后

阿莫迪在他的政策文章里用了一个比喻,树须(Treebeard)。

在托尔金的《指环王》里,树须是一棵古老的树人,它智慧、善良,但行动极度缓慢。霍比特人梅里和皮平焦急万分地请求树须采取行动时,树须的回答是:“不要着急。说一句话,也应该花一整天。”

“这,就是当今AI政策制定的现实。”阿莫迪写道。

我们来看这两条轨道:

阿莫迪的判断非常直接:“AI可以在一项政策制定的时间差内,从有趣的玩具变成数据中心里的天才之国。”

如果你回顾Anthropic的立场演进,会发现一个清晰的轨迹。

2023到2025年,Anthropic的公开立场是支持透明度立法。就是要求AI公司把安全测试结果和模型卡信息交出来。他们帮几个州推过了法案:加州的SB 53,纽约州的RAISE Act,伊利诺伊州的SB 315。

但在2026年6月10日的长文中,阿莫迪正式宣告“纯透明取向的方法已被证明不足”,转向呼吁具有强制力的政府监管。

他提出的方案非常具体,参考美国联邦航空管理局(FAA)模式:就像飞机上天之前必须通过严格的技术测试和适航认证一样,超过一定算力阈值的前沿AI模型,在部署之前必须接受具备资质的第三方机构在四个领域的强制性测试:①网络安全、②生物武器风险、③AI系统失控、④可能加剧上述风险的自动化研发行为。如果测试认定存在不可接受的风险,政府应有权阻止或撤销模型部署。

他甚至给出了更激进的远期判断:如果AI系统的属性继续演化,变得更像“可被用作武器的核材料”而非“民用飞机”,那么监管强度还需要进一步升级。这个逻辑链是:飞机失事会死人,核材料失控会毁灭城市,而失控的超级AI,威胁的可能是全人类的存续。

数据佐证了担忧。

阿莫迪的紧迫感并非空穴来风。他在文章中透露,Claude Mythos Preview在内部安全测试中,确实生成了“具有实战意义的网络安全漏洞”。Anthropic的Project Glasswing(玻璃翼计划)在实际运行中,仅在最初几周内,就在全球最重要的系统中发现了超过一万个高危和严重级别的软件漏洞,导致防御瓶颈从“发现”直接切换到了“修补”。

Bengio团队的国际安全报告也对了这一点。美国DARPA的一场竞赛里,AI在5400万行代码中找出了77%的合成漏洞,修复了其中61%。英国国家网络安全中心预测,到2027年,AI几乎一定会让网络攻击变得更有效、更高效。

所以,阿莫迪的“树须”困境其实是一个算术题:如果AI的能力每4个月翻一番,而政策制定以年为单位推进,那么每过一年,AI与监管之间的“治理鸿沟”就会扩大8倍。这个缺口,不是线性的,而是指数级扩张的。

为何Anthropic喊得最响?

如果你把时间线拉长来看,AI行业对监管的态度,经历了三个阶段。

第一阶段:主动请缨(2023年)。

2023年5月,山姆·奥特曼(Sam Altman)在参议院听证会上做了一个在当时看来颇为大胆的举动,他主动请求国会监管AI。他说,政府应该建立一个新机构,负责为AI模型发放牌照。“如果这项技术出了问题,后果可能相当严重。”

第二阶段:立场分化(2025年)。

到了2025年5月8日,同样是在参议院,Sam Altman的调子发生了微妙但实质性的变化。在这场名为“赢得AI竞赛:加强美国在计算和创新方面的能力”的听证会上,Altman开始强调“轻触式监管”(light-touch regulation),警告立法者不要让“考虑不周的监管”拖慢美国的AI发展。他的核心论点变成了:监管应该只针对“极其强大的前沿模型”,而不是对整个行业施加广泛约束。

2026年6月4日,OpenAI更是在白宫推动新的AI安全框架之际,发布了自己的监管方案,与白宫的自愿审查方案产生了明确分歧。

第三阶段:紧急转向(2026年6月)。

而Anthropic则走了一条几乎相反的路径,从温和透明到激进强制。这种“变脸”不是心血来潮,而是基于一个残酷的判断:风险已经不再是“可能”,而是“正在发生”。

阿莫迪在文章里表示:“公众担忧AI,不是因为我们这些CEO不够乐观,而是因为他们正确地感知到了风险。”

为什么是Anthropic喊得最响?

这个问题值得深究。一个显而易见的事实是:Anthropic是当前AI竞赛中最炙手可热的玩家。2026年6月1日,Anthropic秘密递交了IPO申请,公司年化收入突破470亿美元(2025年底仅为90亿美元),估值达到9650亿美元,超越了OpenAI的8520亿美元。

与此同时,Anthropic正通过Apollo、Blackstone、Broadcom等财团,撬动一个高达350亿美元的算力基础设施融资平台——目标是1GW专用算力,远期甚至支持超过20GW的项目。

一个细节非常耐人寻味:就在阿莫迪呼吁政府强力监管的同一天,Anthropic正在疯狂扩张自己的算力版图。

批评者迅速指出,“安全叙事”本质上是一种竞争策略,让后来者更难追赶。网友们一边倒地认为,Anthropic只想让自己保持领先的狼子野心昭然若揭。

这种质疑不无道理。但如果我们只看到这一层,可能会错过更深层的逻辑。

Anthropic正在做一个极其危险的平衡动作。它一边把模型能力推到极限,一边用“安全”这个框架来约束自己,也约束竞争对手。有专家分析一针见血:真正的AI安全之战,正从模型原则转向物理基础设施控制。因为一旦大型算力集群建成了、芯片采购合同签了、电力协议锁定、债务结构形成,减速就不仅仅是一个技术决策,而是会触动一整条产业链上的利益。芯片制造商、电力公司、数据中心运营商、私人信贷机构,所有人的财务利益都与“持续加速”绑定在一起。

所以阿莫迪说的是真话吗?很可能两者都有。

他确实看到了风险,也确认风险正在迫近,同时他也很清楚,在万亿估值和350亿美元算力赌注面前,任何单方面的减速都等于自杀。这是集体行动困境的典型症状,每个人都知道该慢下来,但没有一个人敢先踩刹车。

这也解释了为什么Anthropic在6月5日发布的《When AI Builds Itself》中,反复强调一个词——“协调”(coordinated)。文章写道:“如果只有一家公司停止发展,竞争对手会加速前进。因此需要多个国家的多家大型AI公司都同意实现可验证的共同减速。”

用博弈论来翻译这段话就是:在囚徒困境里,如果没有人能确保对方也放下武器,没有人会先放下。

结语

将所有线索串联起来,一个令人深思的格局清晰地浮现:

硅谷AI掌门人嘴上的叙事各异,但底层的焦虑殊途同归。人类在过去的几百年里设计出的政治与法律制度,从来没有准备好去迎击一个“指数级”进化的物种。

阿莫迪用“树须”来痛陈政策的滞后;Bengio用数百页安全报告论证现行测试的无能;奥特曼则在“呼吁监管”与“抗拒紧箍咒”之间反复横跳。这些看似矛盾的碎片,拼凑出的正是同一个巨大的时代困境。

在这场关乎人类未来的利益大潮中:“树须”是每一个效率低下的立法机构、每一部流于形式的自愿审查协议,以及每一次流于表面吵闹的国会听证会。而“霍比特人”,则是那些在数据中心深处不眠不休、以每4个月翻一番的速度疯狂进化、已经开始自行编写80%代码的数字造物。

它们之间越拉越大的速度差,正成为我们这个时代最大的风险敞口。

在万字长文的最后,阿莫迪写得克制而沉重:“行动越早,全人类就能越早共享AI带来的巨大价值。”

他隐藏了没有说出口的后半句,但整篇文章的逻辑都在冷酷地指向它:行动越晚,全人类要一起承担的代价,就越不可承受。

这不仅仅是一个硅谷新贵在为自己的企业谋取竞争壁垒,而是一个亲手将科技推向悬崖边缘的造物者,在看清迷雾后的真相时,发出的信号:我们正在穿过一片毫无经验、没有地图的无人区,而在我们身后,来时的桥梁正在熊熊燃烧。

(来源:钛媒体)



用户登录