Skip to content

Token 缓存和成本优化

Gemini CLI 在使用 API 密钥进行身份验证(Gemini API 密钥或 Vertex AI)时,通过 Token 缓存自动优化 API 成本。此功能会重用先前的系统指令和上下文,以减少后续请求中处理的 Token 数量。

Token 缓存适用于:

  • API 密钥用户(Gemini API 密钥)
  • Vertex AI 用户(已设置项目和位置)

Token 缓存不适用于:

  • OAuth 用户(Google 个人/企业账户)- 目前 Code Assist API 不支持缓存内容的创建

您可以使用 /stats 命令查看您的 Token 使用情况和缓存 Token 的节省量。当有可用的缓存 Token 时,它们将显示在统计信息输出中。

基于 MIT 许可证发布