周鸿祎给出的解释,核心是AI和传统互联网的底层逻辑并不一样。他表示,传统互联网的核心是流量,光纤等基础设施的容量接近无限,用户使用流量的成本主要和时长、用量相关,而且平台规模越大,单个用户的边际成本反而越低。也正因为如此,互联网才逐渐跑出了“无限流量”“包月不限量”这样的产品模式。
但AI不是这样。按照周鸿祎的说法,AI的运行本质是**算力消耗、信息处理和“智力成本”**的结合,遵循的是任务复杂度、需求深度与资源消耗正相关的逻辑。任务越复杂、推理越深入,消耗的算力和资源就越高,不可能用极低成本去完成高复杂度工作。换句话说,AI服务不是把现成内容搬运给用户,而是在实时“生产”结果,这让每一次调用都对应着真实的计算成本。
这也是Token在AI时代变得重要的原因。Token本质上是模型处理文本和信息的计量单位,也是人工智能消耗“智力”和算力的结算方式。周鸿祎指出,Token单价相对固定,用量越多,成本越高,这种机制决定了它很难复制手机流量那种包月模式。
过去一个月,围绕智能体的“龙虾热”快速升温,从国家超算互联网发放免费Token额度,到各类Agent平台以极低价格引流,很多人开始把Token想象成下一种“流量”。周鸿祎此次回应的一个现实指向,就是给这种预期降温:AI可以更便宜,但不太可能像传统互联网那样无限摊薄。
这一点背后,也连着更大的产业账本。训练顶级大模型需要消耗数百亿甚至更多Token,对应的算力投入往往以亿元计;阿里巴巴、字节跳动等大厂也都在持续提高云和AI基础设施支出。对于模型公司和平台来说,真正昂贵的不只是“上线一个AI功能”,而是持续维持推理、部署和服务每一次调用。周鸿祎关于“Token不会无限量”的表态,本质上是在提醒市场:AI服务的成本结构,和过去的互联网服务并不是同一套公式。
从产品层面看,这也意味着AI行业的计费方式还会继续演化。未来可能出现更多分层定价、订阅打包、免费额度和企业套餐,但底层仍会围绕算力和Token展开。用户看到的是“包月”“会员”或“免费额度”,平台真正计算的,仍然是背后的模型调用成本。周鸿祎的这番话没有那么激进,却说中了当前AI商业化最现实的一点:在可以无限复制的流量时代之后,AI把“每次请求都有成本”这件事重新带了回来。
对于行业来说,这种成本逻辑未必是坏事。它一方面限制了“无限免费”的想象,另一方面也迫使平台去提高模型效率、压低单位Token成本、优化不同场景的调用方式。Token不会变成手机流量,但它很可能会像电力、算力一样,成为AI时代最基础的计量单位之一。