Google削减对Meta的Gemini算力供给

Source

据《金融时报》援引知情人士消息，Google在今年 3 月前后警告 Meta，无法继续满足其对 Gemini 模型的大规模算力与容量需求，迫使这家社交巨头削减使用并延缓多项内部 AI 项目。目前相关限制仍在持续，Meta 已要求内部员工“看紧”AI token 的消耗，用更为克制的方式调用模型输入、输出与整体使用量，这与过去一年公司在内部大力推广乃至在某些场景“强制”使用 AI 的态度形成鲜明反差。

报道指出，尽管 Meta 近年投入巨资打造自家的 Llama 开源模型，并由首席执行官马克·扎克伯格不断对外宣称 AI 将成为公司下一代核心平台，但在多个关键业务环节上，Meta 实际上却高度依赖Google的 Gemini。有知情人士透露，Meta 在客户服务、广告主聊天机器人、代码生成、可疑或有害内容的下架与诈骗检测等场景中大量使用 Gemini，并且正是因为性能优于 Meta 自家模型，才被选为内部首选解决方案；同时，Anthropic 的 Claude 也在部分业务中参与竞争和使用。

Google对供给的收紧不仅影响 Meta，也波及其他使用Google云和 Gemini 的客户，但 Meta 因为需求量远高于同类客户而显得尤为突出。与Google、微软、亚马逊不同，Meta 并不经营自己的云计算业务，这意味着它在内部自研 AI 系统之外，必须向竞争对手采购外部算力和模型服务，在内部需求快速膨胀的背景下，这种结构性的依赖问题被进一步放大。

为了应对飞涨的 AI 需求，Google近年来持续加码数据中心和专用硬件投资，其云业务季度营收已突破 200 亿美元，未完成订单积压接近 4，600 亿美元，显示出整体算力市场需求远超现有产能。 Google方面称，自家第一方模型通过直接 API 调用，每分钟处理的 token 数量超过 160 亿，较上一季度增幅约 60%，这也从侧面印证了在大模型商业化阶段，算力与容量正成为关键瓶颈资源。

Meta 则试图从另一条路径解决同样的问题：公司一方面扩建自有数据中心，另一方面与博通合作开发定制化 MTIA 加速芯片，希望在未来逐步降低对Google等云服务和模型供应商的依赖。在押注元宇宙受挫之后，Meta 亟需在 AI 领域树立“下一平台”叙事，而本次因过度依赖外部模型而遭遇“被限流”的事件，也暴露出其在基础设施和算力布局上的短板与紧迫性。