算力告急逼出“排他令”：谷歌挥刀向Meta

六月二十八日据英国金融时报报道谷歌因算力紧张限制使用。该模型年调用量翻倍至八百五十亿次并推行配额制。项目受阻转向自研。行业算力告急谷歌紧急租赁扩容。

6月28日，据英国《金融时报》报道，谷歌已对Meta调用其Gemini人工智能大模型实施使用限制。人工智能基础设施的供需矛盾，正在全球顶级科技公司之间激化。

算力告急：Gemini API请求量一年翻倍

此次限制措施的根源，在于Gemini API请求量的爆炸式增长。面对这一迅猛增长，谷歌不得不重新评估其核心AI算力资源的分配策略。

2025年3月至8月期间，Gemini API调用量从约350亿次翻倍至约850亿次。开发者、企业以及科技巨头的日益增长的需求，正持续威胁着现有容量。

谷歌约在今年3月告知Meta，无法满足其全部Gemini算力需求。由于Meta对谷歌模型的需求远高于其他客户，因此受到的影响也最为明显。

从“无限畅饮”到“流量套餐”：谷歌全面收紧算力配额

自2026年5月17日起，谷歌对Gemini应用实施了基于算力额度的全新使用限制系统。新规则类似于“手机流量套餐”：用户不再拥有无限请求，而是在一个每5小时滚动刷新的额度窗口内使用，并设有每周总额度上限。

额度消耗取决于提示词复杂度、使用的模型功能及对话长度等因素。谷歌已记录速率限制和支出层级，旨在确保在该公司所称的快速增长阶段，所有客户都能公平使用API。

谷歌选择实施使用量限制而非单纯扩大基础设施，折射出其经济层面的现实考量：即便对于拥有谷歌体量的公司而言，要满足不受约束的AI需求所需的资本支出也令人望而生畏。

Meta项目受阻，被迫“精打细算”用AI

算力限制对Meta造成了实质性冲击，打乱并推迟了Meta多项内部人工智能项目的推进节奏。受此影响，叠加公司整体压缩AI成本的战略，Meta已要求员工节约调用token，提升使用效率。

Meta在内部广泛使用Gemini，涵盖包括平台安全审核、客服及广告辅助聊天机器人，以及部分内部工作流和代码开发等的各种工作。Meta最初选择Gemini，是因为其表现优于公司自研的Llama开源模型。

然而随着算力限制的收紧，Meta正加快向自研模型迁移。

Meta近期已开始优先推广其新推出的Muse Spark模型，该模型被认为在性能上已能与Gemini相抗衡。Meta CEO马克·扎克伯格持续加大对AI人才和基础设施的投入，并承诺到2028年在美国累计投资6000亿美元自建数据中心。

（Meta CEO马克·扎克伯格）

行业瓶颈：巨头也难逃算力荒

这起事件凸显了当前AI发展的核心瓶颈：即使全球科技巨头持续投入数千亿美元兴建数据中心并采购AI芯片，整体基础设施仍难以追上生成式AI快速扩张所带来的需求。

谷歌云端事业最新财报也反映了同样的问题。

在截至2026年第一季度，谷歌云营收达200亿美元，但Alphabet CEO皮查伊当时表示，算力限制使谷歌云无法承接更多客户需求，也让该部门积压订单较前一季接近倍增。皮查伊在财报会议上坦言：“近期我们在算力方面确实面临制约，如果能够满足需求，云业务收入将会更高。”

除Meta之外，其他谷歌客户也受到算力不足的影响，但程度相对有限。多位知情人士指出，正是Meta等大型企业客户的高强度需求，直接推动谷歌加速寻求外部算力来源。

紧急扩容：行业寻求破局

面对持续加大的算力压力，谷歌本月早些时候与埃隆·马斯克旗下SpaceX签订了一份自今年十月起每月9.2亿美元的算力租赁协议。Anthropic上月也与SpaceX达成了类似协议。

谷歌对Meta采取限制措施一事，为外界提供了一个罕见窗口，得以窥见全球顶级AI服务商在算力分配上所面临的真实压力。当前，整个AI行业的基础设施瓶颈正从训练侧蔓延至模型训练完成后在实际应用中执行任务所消耗的算力。

随着企业大规模部署聊天机器人、编程助手和AI智能体，推理工作负载正以超出预期的速度消耗着宝贵的算力资源。供需矛盾的化解，仍有赖于新一轮大规模资本投入的落地兑现。