Token 缓存与成本优化

当使用 API key(Gemini API key 或 Vertex AI)进行认证时,Gemini CLI 会自动启用 Token 缓存以优化 API 成本。该功能会复用既有的系统指令与上下文,从而在后续请求中减少需要处理的 Token 数。

支持 Token 缓存的场景:

  • 使用 Gemini API key 的用户;
  • 使用 Vertex AI 且已配置项目与地域的用户。

暂不支持 Token 缓存的场景:

  • OAuth 认证(Google 个人/企业账号)。当前 Code Assist API 尚不支持缓存内容的生成。

可以通过 /stats 命令查看 Token 使用情况。当存在缓存 Token 时,统计输出中会显示相应的节省值。