Token 缓存与成本优化

当使用 API key（Gemini API key 或 Vertex AI）进行认证时，Gemini CLI 会自动启用 Token 缓存以优化 API 成本。该功能会复用既有的系统指令与上下文，从而在后续请求中减少需要处理的 Token 数。

支持 Token 缓存的场景：

暂不支持 Token 缓存的场景：

可以通过 /stats 命令查看 Token 使用情况。当存在缓存 Token 时，统计输出中会显示相应的节省值。