Claude Code 用量限制

解释 Claude Code 用量限制、模型选择、上下文管理、订阅与 API 计费差异,以及如何减少额度浪费。

Claude Code 的用量限制不是简单的“还能发多少条消息”。模型、上下文、读取文件、工具调用、会话长度和登录方式都会影响消耗速度。

最后核查:2026 年 5 月 24 日。具体额度、reset 窗口、模型名称和 credits 规则可能变化。遇到冲突时,以 Claude Code 内提示和账号后台为准。

短答案

如果你通过 Claude 订阅登录,用量受计划和账号状态影响,并且可能与其他 Claude 产品表面共享。如果你通过 API key 或云厂商登录,通常按 token 和供应商规则计费。无论哪种方式,长会话加大上下文都是最容易耗尽用量的组合。

什么会消耗用量

每一轮对话都可能携带:

  1. 当前会话历史。
  2. CLAUDE.md、rules、skills、MCP 输出和已读取文件。
  3. 你的新 prompt。
  4. 工具调用、搜索结果、命令输出和 diff。
  5. 模型本身的推理开销。

最容易被忽略的是历史上下文。一个已经读过很多文件、生成过很多 diff 的会话,后续每一轮都会比全新会话更重。

订阅和 API 的差异

登录方式到限制时的表现应检查
Pro、Max、Team、Enterprise /login显示 limit 或 reset 时间。/status/model、计划设置、usage credits。
Claude Console API key可能不会硬停,而是继续计费。/status/cost/usage、Console 用量和 spend limits。
Bedrock、Vertex AI、Microsoft Foundry受云厂商账单和 rate limits 影响。云后台、provider quotas、Claude Code 认证配置。
Enterprise seat受组织池和策略影响。管理后台、组织限制、reset 提示、policy 配置。

有用命令

命令用途
/model查看并切换账号可用模型。
/status确认当前账号和凭据路径。
/clear清空会话历史,保留项目记忆,适合换任务。
/compact把长会话压缩成摘要,适合中途继续。
/context查看当前上下文里装了什么。
/cost/usage在可用时查看当前会话 token 或费用估算。

让额度更耐用的 5 个习惯

  1. 不同任务之间先 /clear
  2. 日常用 Sonnet,困难规划用 Opus,简单批量任务用 Haiku。
  3. 多文件修改前先要 plan。
  4. 引用路径,不要粘贴整个文件。
  5. CLAUDE.md 只保留真正稳定有用的规则。

达到限制后怎么办

  • 如果提示 reset 时间,可以等待、切轻量模型、购买 usage credits,或把高强度任务转到 API。
  • 如果是 context window 满了,用 /compact/clear,这和计划用量限制不是一回事。
  • 如果 API 账单异常,先停脚本,再检查长上下文、MCP 大输出、循环重试和模型选择。
  • 如果近期体感突然变化,检查官方更新、当前模型和是否启用了更长上下文。

相关页面

官方来源