Claude Code 用量限制
解释 Claude Code 用量限制、模型选择、上下文管理、订阅与 API 计费差异,以及如何减少额度浪费。
Claude Code 的用量限制不是简单的“还能发多少条消息”。模型、上下文、读取文件、工具调用、会话长度和登录方式都会影响消耗速度。
最后核查:2026 年 5 月 24 日。具体额度、reset 窗口、模型名称和 credits 规则可能变化。遇到冲突时,以 Claude Code 内提示和账号后台为准。
短答案
如果你通过 Claude 订阅登录,用量受计划和账号状态影响,并且可能与其他 Claude 产品表面共享。如果你通过 API key 或云厂商登录,通常按 token 和供应商规则计费。无论哪种方式,长会话加大上下文都是最容易耗尽用量的组合。
什么会消耗用量
每一轮对话都可能携带:
- 当前会话历史。
CLAUDE.md、rules、skills、MCP 输出和已读取文件。- 你的新 prompt。
- 工具调用、搜索结果、命令输出和 diff。
- 模型本身的推理开销。
最容易被忽略的是历史上下文。一个已经读过很多文件、生成过很多 diff 的会话,后续每一轮都会比全新会话更重。
订阅和 API 的差异
| 登录方式 | 到限制时的表现 | 应检查 |
|---|---|---|
Pro、Max、Team、Enterprise /login | 显示 limit 或 reset 时间。 | /status、/model、计划设置、usage credits。 |
| Claude Console API key | 可能不会硬停,而是继续计费。 | /status、/cost 或 /usage、Console 用量和 spend limits。 |
| Bedrock、Vertex AI、Microsoft Foundry | 受云厂商账单和 rate limits 影响。 | 云后台、provider quotas、Claude Code 认证配置。 |
| Enterprise seat | 受组织池和策略影响。 | 管理后台、组织限制、reset 提示、policy 配置。 |
有用命令
| 命令 | 用途 |
|---|---|
/model | 查看并切换账号可用模型。 |
/status | 确认当前账号和凭据路径。 |
/clear | 清空会话历史,保留项目记忆,适合换任务。 |
/compact | 把长会话压缩成摘要,适合中途继续。 |
/context | 查看当前上下文里装了什么。 |
/cost 或 /usage | 在可用时查看当前会话 token 或费用估算。 |
让额度更耐用的 5 个习惯
- 不同任务之间先
/clear。 - 日常用 Sonnet,困难规划用 Opus,简单批量任务用 Haiku。
- 多文件修改前先要 plan。
- 引用路径,不要粘贴整个文件。
CLAUDE.md只保留真正稳定有用的规则。
达到限制后怎么办
- 如果提示 reset 时间,可以等待、切轻量模型、购买 usage credits,或把高强度任务转到 API。
- 如果是 context window 满了,用
/compact或/clear,这和计划用量限制不是一回事。 - 如果 API 账单异常,先停脚本,再检查长上下文、MCP 大输出、循环重试和模型选择。
- 如果近期体感突然变化,检查官方更新、当前模型和是否启用了更长上下文。