从盗版到“洗白”？Anthropic耗资数千万美元的“巴拿马项目”浮出水面

从盗版网站下载数百万册书籍，到斥巨资采购实体书、切掉书脊扫描后销毁——Anthropic正在以一种近乎工业化的方式，为Claude“喂养”人类知识库。

2026年初，超过4000页的法庭文件在美国联邦法院被解封，一家AI巨头持续数年的秘密计划被完整曝光。

这份内部文件被其创造者标注为“巴拿马项目”，目标是“以破坏性方式扫描全球所有书籍”，而它的创造者，是与OpenAI齐名、目前估值已超过1800亿美元的AI独角兽——Anthropic。

从盗版网站到实体书仓库

“巴拿马项目”并非Anthropic获取训练数据的唯一方式。事实上，在启动实体书扫描之前，这家公司已经尝试过一条更简单粗暴的路径。

据法庭文件披露，2021年6月，Anthropic联合创始人本·曼恩在11天内，从一个名为“Library Genesis”（LibGen）的盗版“影子图书馆”网站，下载了大量小说和非小说类书籍。

一年后，另一个网站Pirate Library Mirror上线，公开宣称“在大多数国家故意违反版权法”。曼恩将这个网站的链接发给了Anthropic其他员工，并留言写道：“来得正是时候！！！”

根据2025年6月的一项法庭裁决，Anthropic从LibGen累计下载了约500万本盗版书籍，从Pirate Library Mirror下载了约200万本。

但这条路很快就走到了尽头。2025年9月5日，Anthropic与作家集体诉讼达成和解协议，同意支付15亿美元。这是AI行业版权侵权案中金额最高的和解案例之一。根据协议，每部侵权作品获得约3000美元赔偿；受影响的书籍总数约为50万本。

“巴拿马项目”的操作链

在支付了15亿美元和解金之后，Anthropic转向了一条成本更高、但法律风险更低的路线——“巴拿马项目”。

Anthropic专门聘请了曾参与创建Google图书项目的资深高管汤姆·特维来主持这项工作。该项目的核心目标明确而直接：以工业化的方式获取海量书籍，用它们来训练Claude背后的AI模型。

具体操作流程令人印象深刻：工作人员将成批采购的实体书运往仓库，用液压切割机切掉书脊，将散开的书页送入高速生产级扫描仪，转化为高清PDF文件，然后直接将纸质残骸送往回收公司销毁。

支持这一行动的，是持续且巨额的采购投入。Anthropic主要从Better World Books和英国的World of Books两家二手书零售商批量拿货，每次采购动辄数万册。内部文件还显示，员工曾讨论接洽纽约公共图书馆。完成这一操作后，供应商用液压切割机将书脊整齐切掉，散开的书页随后被高速、高质量的生产级扫描仪进行扫描。

法律逻辑与法官态度

“巴拿马项目”之所以采用这种“买书→扫描→销毁”的极端操作，背后有一个清晰的法律逻辑链条。

Anthropic的律师团队在法庭上提出了双重辩护：其一，基于“首次销售原则”——一旦合法购买了一本书，所有权人有权对该副本进行任何处理，包括处置和销毁。其二，叠加“合理使用”的多因素判断——扫描件仅用于内部AI训练，不对外分发，且数字化版本不替代原书市场。“首次销售原则”提供了一个关键的保护：由于副本被销毁，不会产生新的版权副本流入市场，从而规避了“非法复制”的指控链条。

在2025年针对盗版数据集的集体诉讼中，法官虽裁定从LibGen等网站盗版下载书籍违法，但对于“合法购买实体书+破坏性扫描”的模式，法官整体倾向于认为具备较强的合理使用抗辩基础。

被放大的“文化浩劫”与伦理困境

“巴拿马项目”曝光后，社交媒体上出现了“Anthropic蒸馏了人类知识库”“古籍浩劫”等说法。但实际情况没有那么极端。Anthropic采购的书籍主要是市场上流通量较大的普通商业二手书，并非孤本、善本等具有文物价值的历史文献。真正抗议的主力是作家和出版商协会——由于他们的版权被侵犯，而非文物保护机构。

但Anthropic的做法对中小作者的打击是真实的。世界各地的独立作者无法聘请顶级律所追责，当自己的作品被切碎化为数字比特时，他们能做的只是看着。真正让一些作者感到沉重的是：他们并不是在和一家公司对抗，而是在对抗一套已成规模的工业生产体系。

“巴拿马项目”的命运正处于关键的司法窗口期。作家集体诉讼的最终批准听证会定于2026年5月14日举行，届时法院将最终决定是否批准Anthropic支付15亿美元和解金。如果获批，Anthropic将从两个方向彻底摆脱版权追责的泥潭——既往盗版数据以15亿美元画上句号，后续训练则通过“巴拿马项目”的模式走通一条可防御的法律路径。若法院最终否定这一模式，则意味着不止Anthropic，整个AI行业的版权合规路径都需要重新思考。

与此同时，随着Anthropic Pre-IPO估值突破1.2万亿美元，股东和市场对合规成本的容忍阈值正在明显提高。“巴拿马项目”每年的运营支出在数千万美元级别，与15亿美元的一次性赔偿相比，已不再是显性成本，而是从“债务”转变为“风险缓释”的防御性投资。真正的代价不在账面，而在法律的模糊地带中那些从未被写进合同的道德成本。