2026年初,超过4000页的法庭文件在美国联邦法院被解封,一家AI巨头持续数年的秘密计划被完整曝光。
这份内部文件被其创造者标注为“巴拿马项目”,目标是“以破坏性方式扫描全球所有书籍”,而它的创造者,是与OpenAI齐名、目前估值已超过1800亿美元的AI独角兽——Anthropic。

从盗版网站到实体书仓库
“巴拿马项目”并非Anthropic获取训练数据的唯一方式。事实上,在启动实体书扫描之前,这家公司已经尝试过一条更简单粗暴的路径。
据法庭文件披露,2021年6月,Anthropic联合创始人本·曼恩在11天内,从一个名为“Library Genesis”(LibGen)的盗版“影子图书馆”网站,下载了大量小说和非小说类书籍。
一年后,另一个网站Pirate Library Mirror上线,公开宣称“在大多数国家故意违反版权法”。曼恩将这个网站的链接发给了Anthropic其他员工,并留言写道:“来得正是时候!!!”
根据2025年6月的一项法庭裁决,Anthropic从LibGen累计下载了约500万本盗版书籍,从Pirate Library Mirror下载了约200万本。
但这条路很快就走到了尽头。2025年9月5日,Anthropic与作家集体诉讼达成和解协议,同意支付15亿美元。这是AI行业版权侵权案中金额最高的和解案例之一。根据协议,每部侵权作品获得约3000美元赔偿;受影响的书籍总数约为50万本。
“巴拿马项目”的操作链
在支付了15亿美元和解金之后,Anthropic转向了一条成本更高、但法律风险更低的路线——“巴拿马项目”。
Anthropic专门聘请了曾参与创建Google图书项目的资深高管汤姆·特维来主持这项工作。该项目的核心目标明确而直接:以工业化的方式获取海量书籍,用它们来训练Claude背后的AI模型。
具体操作流程令人印象深刻:工作人员将成批采购的实体书运往仓库,用液压切割机切掉书脊,将散开的书页送入高速生产级扫描仪,转化为高清PDF文件,然后直接将纸质残骸送往回收公司销毁。
支持这一行动的,是持续且巨额的采购投入。Anthropic主要从Better World Books和英国的World of Books两家二手书零售商批量拿货,每次采购动辄数万册。内部文件还显示,员工曾讨论接洽纽约公共图书馆。完成这一操作后,供应商用液压切割机将书脊整齐切掉,散开的书页随后被高速、高质量的生产级扫描仪进行扫描。
法律逻辑与法官态度
“巴拿马项目”之所以采用这种“买书→扫描→销毁”的极端操作,背后有一个清晰的法律逻辑链条。
Anthropic的律师团队在法庭上提出了双重辩护:其一,基于“首次销售原则”——一旦合法购买了一本书,所有权人有权对该副本进行任何处理,包括处置和销毁。其二,叠加“合理使用”的多因素判断——扫描件仅用于内部AI训练,不对外分发,且数字化版本不替代原书市场。“首次销售原则”提供了一个关键的保护:由于副本被销毁,不会产生新的版权副本流入市场,从而规避了“非法复制”的指控链条。
在2025年针对盗版数据集的集体诉讼中,法官虽裁定从LibGen等网站盗版下载书籍违法,但对于“合法购买实体书+破坏性扫描”的模式,法官整体倾向于认为具备较强的合理使用抗辩基础。
被放大的“文化浩劫”与伦理困境
“巴拿马项目”曝光后,社交媒体上出现了“Anthropic蒸馏了人类知识库”“古籍浩劫”等说法。但实际情况没有那么极端。Anthropic采购的书籍主要是市场上流通量较大的普通商业二手书,并非孤本、善本等具有文物价值的历史文献。真正抗议的主力是作家和出版商协会——由于他们的版权被侵犯,而非文物保护机构。
但Anthropic的做法对中小作者的打击是真实的。世界各地的独立作者无法聘请顶级律所追责,当自己的作品被切碎化为数字比特时,他们能做的只是看着。真正让一些作者感到沉重的是:他们并不是在和一家公司对抗,而是在对抗一套已成规模的工业生产体系。
“巴拿马项目”的命运正处于关键的司法窗口期。作家集体诉讼的最终批准听证会定于2026年5月14日举行,届时法院将最终决定是否批准Anthropic支付15亿美元和解金。如果获批,Anthropic将从两个方向彻底摆脱版权追责的泥潭——既往盗版数据以15亿美元画上句号,后续训练则通过“巴拿马项目”的模式走通一条可防御的法律路径。若法院最终否定这一模式,则意味着不止Anthropic,整个AI行业的版权合规路径都需要重新思考。
与此同时,随着Anthropic Pre-IPO估值突破1.2万亿美元,股东和市场对合规成本的容忍阈值正在明显提高。“巴拿马项目”每年的运营支出在数千万美元级别,与15亿美元的一次性赔偿相比,已不再是显性成本,而是从“债务”转变为“风险缓释”的防御性投资。真正的代价不在账面,而在法律的模糊地带中那些从未被写进合同的道德成本。