现在是2026年。每个人都在使用claude代码,每天生成一万亿个代币。与此同时,大多数开放模型提供商仍然不将缓存命中传递给他们的消费者,使得每条新消息都成为一项昂贵的努力。