Token 缓存与成本优化
当使用 API key(Gemini API key 或 Vertex AI)进行认证时,Gemini CLI 会自动启用 Token 缓存以优化 API 成本。该功能会复用既有的系统指令与上下文,从而在后续请求中减少需要处理的 Token 数。
支持 Token 缓存的场景:
- 使用 Gemini API key 的用户;
- 使用 Vertex AI 且已配置项目与地域的用户。
暂不支持 Token 缓存的场景:
- OAuth 认证(Google 个人/企业账号)。当前 Code Assist API 尚不支持缓存内容的生成。
可以通过 /stats 命令查看 Token 使用情况。当存在缓存 Token 时,统计输出中会显示相应的节省值。