Google削减对Meta的Gemini算力供给

Source
据《金融时报》援引知情人士消息,Google在今年 3 月前后警告 Meta,无法继续满足其对 Gemini 模型的大规模算力与容量需求,迫使这家社交巨头削减使用并延缓多项内部 AI 项目。 目前相关限制仍在持续,Meta 已要求内部员工“看紧”AI token 的消耗,用更为克制的方式调用模型输入、输出与整体使用量,这与过去一年公司在内部大力推广乃至在某些场景“强制”使用 AI 的态度形成鲜明反差。

报道指出,尽管 Meta 近年投入巨资打造自家的 Llama 开源模型,并由首席执行官马克·扎克伯格不断对外宣称 AI 将成为公司下一代核心平台,但在多个关键业务环节上,Meta 实际上却高度依赖Google的 Gemini。 有知情人士透露,Meta 在客户服务、广告主聊天机器人、代码生成、可疑或有害内容的下架与诈骗检测等场景中大量使用 Gemini,并且正是因为性能优于 Meta 自家模型,才被选为内部首选解决方案;同时,Anthropic 的 Claude 也在部分业务中参与竞争和使用。

Google对供给的收紧不仅影响 Meta,也波及其他使用Google云和 Gemini 的客户,但 Meta 因为需求量远高于同类客户而显得尤为突出。 与Google、微软、亚马逊不同,Meta 并不经营自己的云计算业务,这意味着它在内部自研 AI 系统之外,必须向竞争对手采购外部算力和模型服务,在内部需求快速膨胀的背景下,这种结构性的依赖问题被进一步放大。

为了应对飞涨的 AI 需求,Google近年来持续加码数据中心和专用硬件投资,其云业务季度营收已突破 200 亿美元,未完成订单积压接近 4,600 亿美元,显示出整体算力市场需求远超现有产能。 Google方面称,自家第一方模型通过直接 API 调用,每分钟处理的 token 数量超过 160 亿,较上一季度增幅约 60%,这也从侧面印证了在大模型商业化阶段,算力与容量正成为关键瓶颈资源。

Meta 则试图从另一条路径解决同样的问题:公司一方面扩建自有数据中心,另一方面与博通合作开发定制化 MTIA 加速芯片,希望在未来逐步降低对Google等云服务和模型供应商的依赖。 在押注元宇宙受挫之后,Meta 亟需在 AI 领域树立“下一平台”叙事,而本次因过度依赖外部模型而遭遇“被限流”的事件,也暴露出其在基础设施和算力布局上的短板与紧迫性。