谷歌为 Gemini 推出新功能,降低 AI 成本

Source

品玩5月12日讯,据 TechCrunch 报道,谷歌为 Gemini API 推出新功能implicit caching,将使其模型成本降低。

据悉,implicit caching 通过 Gemini API 传递给模型的 “重复上下文 ”可以节省 75% 的成本。该功能目前支持Gemini 2.5 Pro 和 2.5 Flash 模型。

Gemini 2.5 模型默认已启用隐式缓存,如果 Gemini API 对模型的请求命中缓存,隐式缓存就会传递节省的成本。