谷歌为 Gemini 推出新功能，降低 AI 成本

Source

品玩5月12日讯，据 TechCrunch 报道，谷歌为 Gemini API 推出新功能implicit caching，将使其模型成本降低。

据悉，implicit caching 通过 Gemini API 传递给模型的 “重复上下文 ”可以节省 75% 的成本。该功能目前支持Gemini 2.5 Pro 和 2.5 Flash 模型。

Gemini 2.5 模型默认已启用隐式缓存，如果 Gemini API 对模型的请求命中缓存，隐式缓存就会传递节省的成本。