Anthropic呼吁全球暂缓前沿AI研发 警告“递归式自我改进”风险日益迫近
靳紫馨(Vivian Jin)
靳紫馨(Vivian Jin)

2026[[ $t('article.detail.demo_date') ]] · 123 [[ $t('article.detail.read') ]]

Anthropic呼吁全球暂缓前沿AI研发 警告“递归式自我改进”风险日益迫近

Anthropic公开呼吁全球暂缓前沿AI研发,警告“递归式自我改进”可能很快到来并引发重大安全风险。

就在Anthropic以9650亿美元估值完成H轮融资、一举超越OpenAI成为全球估值最高的私营AI公司后不久,该公司联合创始人Jack Clark与研究员Marina Favaro在本周公开发出强烈呼吁:全球顶尖AI实验室应考虑放缓研发步伐。理由是AI系统正如此迅猛进步,可能很快就能在无需人类干预的情况下实现“递归式自我改进”,对社会构成重大安全风险。

递归式自我改进:AI正逼近“自我进化”临界点

当地时间6月4日,Anthropic在官方博客发布了一篇题为《当AI构建自身》(When AI Builds Itself)的博客文章,基于内部数据详实记录了其最先进模型能力提升的惊人速度。文章由公司联合创始人Jack Clark和内部研究机构负责人Marina Favaro联合署名,首次罕见对外披露了一批此前从未公开的内部运营数据。

文章指出,AI正在以惊人速度加速AI自身的开发进程:截至2026年5月,Anthropic超过80%合并入代码库的代码由Claude撰写;与2024年相比,工程师每日合并代码量已增长8倍;在一项内部研究调查中,员工估计使用最新模型Mythos Preview后,自身产出约为不使用任何AI工具时的4倍。

更关键的是,当前AI模型的进步正朝着“递归式自我改进”(Recursive Self-Improvement,RSI)的方向发展——即AI系统能够在无需人类干预的情况下自行提升能力

Anthropic联合创始人Jack Clark承认,有理由相信部分前沿模型正在接近AI能够自主改进后续模型的阶段,这一节点可能在未来一到两年内就会到来。

全球暂停机制:Anthropic提议效仿核武条约

“我们认为,世界若能拥有放缓或暂时暂停前沿AI开发的选项,以使社会结构和一致性研究跟上技术进步的步伐,这将是一件好事。”文章写道。

文章提议就如何放缓开发达成一项全球协议,并建立一个核查竞争对手是否遵守该协议的机制。

Anthropic将这一问题比作核武器条约,但承认制止作弊将更加棘手——训练运行远比导弹发射井更容易隐蔽,其输入是通用的,且秘密违约的激励巨大。公司计划在未来几个月与政策制定者、研究人员和其他人士组织对话,帮助回答关于RSI和核查系统的问题。

估值近万亿美元:资本扩张与安全呼吁的悖论

Anthropic的这一呼吁发生在极为微妙的时间节点。就在本周,该公司刚完成650亿美元H轮融资,估值飙升至9650亿美元,首度超越OpenAI,登顶全球AI估值榜首。紧接着,Anthropic向美国证券交易委员会秘密递交了S-1上市申请,正式启动公开上市流程,预计最早将在今年10月登陆资本市场。

Anthropic正同步推进着两条截然不同的战略路线:一边加速向公开市场寻求资本,一边公开呼吁全球放缓前沿AI开发步伐。

联合创始人兼总裁Daniela Amodei在旧金山峰会上坦陈,开发AI模型的惊人成本正促使她们这样的公司转向公开资本市场寻求资金。这一内在张力——既是“AI速度”的受益者,又试图做“减速”的倡导者——是理解Anthropic此次行动的根本背景。

争议与分歧:“监管俘获”还是真诚担忧?

长期以来,批评者认为Anthropic以“AI安全”为核心的政策主张,实际上是在借监管手段限制竞争对手的发展速度。风险投资家、特朗普的非正式顾问David Sacks曾在近期播客中公开指责Anthropic的领导者推行“监管俘获议程”,称其正在推动华盛顿出台禁令限制开源大模型

宾夕法尼亚大学沃顿商学院教授Ethan Mollick的评论则相对中肯:Anthropic的文章中“既有一些自我反思,也有一些营销成分”,但更重要的是,“Anthropic真诚地表达了他们对未来AI发展的判断,而这些判断值得关注。

在Anthropic发出警报的同一天,美国总统特朗普签署了关于加强AI模型审查的行政令,要求主要的AI开发者在向公众发布最先进模型之前,自愿提交模型供政府进行网络安全测试。这标志着美国联邦政府在AI安全治理层面迈出了实质性一步。

长期悬而未决的分歧在于:现有AI模型距离递归自我优化这一技术拐点到底还有多远。Anthropic一方也承认递归自主优化目前尚未成为现实,也并非必然出现,只是警示其落地窗口可能比多数机构预期来得更快。

由Anthropic发起的这场“减速”讨论,已将AI安全议题再次推到了全球公共议程的中心。当一家估值近万亿美元的AI公司公开呼吁放缓自身所处行业的研发速度,这对整个行业产生的冲击力,或许比它宣称的技术风险本身更值得审视。

(来源:www.wsj.com;www.anthropic.com)