Claude API 的缓存基于前缀匹配——从请求的第一个 token 开始,连续匹配已缓存的前缀。
命中的部分收费降低 90%($0.30/MTok → $0.03/MTok)。
Claude Code 精心安排 cache_control 断点:静态内容放在前面(global),动态内容放在后面(null)。
cache_control