定价

了解 Anthropic 的模型和功能定价结构

本页提供 Anthropic 模型和功能的详细定价信息。所有价格均为美元。

有关最新的定价信息，请访问 claude.com/pricing。

模型定价

下表显示所有 Claude 模型的定价：

模型	基础输入令牌	5 分钟缓存写入	1 小时缓存写入	缓存命中和刷新	输出令牌
Claude Opus 4.7	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.6	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.5	$5 / MTok	$6.25 / MTok	$10 / MTok	$0.50 / MTok	$25 / MTok
Claude Opus 4.1	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4（已弃用）	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 4.6	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4.5	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4（已弃用）	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 4.5	$1 / MTok	$1.25 / MTok	$2 / MTok	$0.10 / MTok	$5 / MTok
Claude Haiku 3.5（已退役，Bedrock 和 Vertex AI 除外）	$0.80 / MTok	$1 / MTok	$1.60 / MTok	$0.08 / MTok	$4 / MTok

Note

MTok = 百万令牌。"基础输入令牌"列显示标准输入定价，"5 分钟缓存写入"、"1 小时缓存写入"和"缓存命中和刷新"列特定于提示缓存，"输出令牌"显示输出定价。有关缓存列和定价乘数的解释，请参见提示缓存定价。

Note

与之前的模型相比，Opus 4.7 使用新的分词器，这有助于提高其在广泛任务上的性能。对于相同的固定文本，这个新分词器可能会多使用最多 35% 的令牌。

有关 AWS 上 Claude Platform 的定价，请参见 AWS 上 Claude Platform 的定价。

云平台定价

本节涵盖合作伙伴运营的云平台，其中云提供商向您开具账单。有关通过市场计费的 Anthropic 运营的云平台，请参见 AWS 上 Claude Platform 的定价和 Microsoft Foundry 中的 Claude。

Claude 模型可在 Amazon Bedrock 和 Vertex AI 上使用。有关官方定价，请访问：

Note

Claude 4.5 模型及之后的区域和多区域端点定价

从 Claude Sonnet 4.5、Haiku 4.5 和 Opus 4.5 开始：

Bedrock 提供两种端点类型：全局端点（动态路由以获得最大可用性）和区域端点（保证通过特定地理区域的数据路由）。
Vertex AI 提供三种端点类型：全局端点、多区域端点（在地理区域内动态路由）和区域端点。

区域和多区域端点比全局端点贵 10%。Claude API（第一方）默认为全局；有关第一方数据驻留选项和定价，请参见数据驻留定价。

范围： 此定价结构适用于 Claude Sonnet 4.5、Haiku 4.5、Opus 4.5 及所有未来模型。早期模型（Claude Sonnet 4（已弃用）、Opus 4（已弃用）及更早版本）保留其现有定价。

有关实现细节和代码示例：

Amazon Bedrock 全局与区域端点适用于 Opus 4.7、Haiku 4.5 及之后的模型，或旧版集成适用于 Bedrock 上的所有其他模型
Vertex AI 全局、多区域和区域端点

AWS 上 Claude Platform 的定价

AWS 上的 Claude Platform 通过 AWS Marketplace 使用 Claude 消费单元（CCU）计费。Anthropic 以美元按标准的每模型、每功能费率评估您的令牌使用量，应用任何协商折扣，按每 CCU $0.01 将结果转换为 CCU，并每小时向 AWS Marketplace 报告 CCU 数量。您的 AWS 账单显示单个 CCU 行项目。

概念	详情
计费单元	Claude 消费单元（CCU）
CCU 价格	每 CCU $0.01（固定；折扣适用于令牌到 CCU 的转换，不适用于 CCU 价格）
转换	令牌使用量按标准的每模型、每功能费率（与 Claude API 定价相同）以美元评估，然后按每 CCU $0.01 转换为 CCU
计费周期	每小时向 AWS Marketplace 计量；每月开具发票
付款模式	仅后付款（后付）；无预付额度
折扣	以更少的 CCU 计量方式应用
税务	税前计量；AWS Marketplace 处理税务
成本可见性	Claude Console 中的实时细分（通过 AWS Console 访问）；AWS Cost Explorer 显示聚合的 CCU

Note

Claude 消费单元。 如果客户通过某些市场平台（例如，AWS 上的 Claude Platform）访问服务，使用量将以 Claude 消费单元（"CCU"）而非每 MTok 开具发票。CCU 是仅用于市场平台计费的计量单位。一百（100）CCU 代表因服务而欠的 $1.00 美元费用，按 claude.com/pricing#api 上的适用价格计算，应用任何折扣后。

推理地理位置

对于 Claude Opus 4.6、Claude Sonnet 4.6 及之后的模型，使用 inference_geo: "us" 适用 1.1 倍定价乘数。inference_geo: "global"（默认）使用标准定价。详情请参见数据驻留。

私有报价

当您在 AWS Console AWS 上的 Claude Platform 服务页面上注册时，AWS Console 会查找与您账户关联的任何私有报价，并提示您在 AWS Marketplace 中接受它。有关私有报价条款，请联系您的 Anthropic 客户代表。

Note

如果您有现有的 Amazon Bedrock 私有报价，在开始使用 AWS 上的 Claude Platform 之前，请联系您的 Anthropic 或 AWS 客户代表，以确保您的折扣正确应用。折扣不能追溯应用于在您的私有报价被接受之前产生的使用量。

特定功能定价

提示缓存

提示缓存通过在 API 调用之间重复使用先前处理的提示部分来降低成本和延迟。API 不是在每次请求时重新处理相同的大型系统提示、文档或对话历史，而是以标准输入价格的一小部分从缓存中读取。

有两种方式可以启用提示缓存：

自动缓存： 在请求的顶层添加单个 cache_control 字段。系统会随着对话的增长自动管理缓存断点。这是大多数用例的推荐起点。
显式缓存断点： 将 cache_control 直接放在单个内容块上，以精确控制哪些内容被缓存。

提示缓存使用以下相对于基础输入令牌费率的定价乘数：

缓存操作	乘数	持续时间
5 分钟缓存写入	1.25 倍基础输入价格	缓存有效 5 分钟
1 小时缓存写入	2 倍基础输入价格	缓存有效 1 小时
缓存读取（命中）	0.1 倍基础输入价格	与之前的写入相同持续时间

缓存写入令牌在首次存储内容时收费。缓存读取令牌在后续请求检索缓存内容时收费。缓存命中花费标准输入价格的 10%，这意味着对于 5 分钟持续时间（1.25 倍写入），仅需一次缓存读取即可收回缓存成本，对于 1 小时持续时间（2 倍写入），需要两次缓存读取。

这些乘数与其他定价修饰符叠加，包括 Batch API 折扣和数据驻留。

有关实现细节、支持的模型和代码示例，请参见提示缓存。

数据驻留定价

对于 Claude Opus 4.6、Claude Sonnet 4.6 及之后的模型，通过 inference_geo 参数指定仅美国推理会对所有令牌定价类别产生 1.1 倍乘数，包括输入令牌、输出令牌、缓存写入和缓存读取。全局路由（默认）使用标准定价。

这适用于 Claude API（第一方）和 AWS 上的 Claude Platform。合作伙伴运营的平台（Bedrock 和 Vertex AI）有独立的区域定价。详情请参见 Bedrock 和 Vertex AI。早期模型不支持 inference_geo 参数并始终使用标准定价；在这些模型上包含该参数的请求将返回 400 错误。

更多信息请参见数据驻留。

快速模式定价

快速模式（测试版，研究预览）以高级定价（6 倍标准费率）为 Claude Opus 4.6 和 Claude Opus 4.7 提供显著更快的输出。快速模式定价适用于整个上下文窗口，包括超过 200k 输入令牌的请求。快速模式在 AWS 上的 Claude Platform 上不可用。

输入	输出
$30 / MTok	$150 / MTok

快速模式定价与其他定价修饰符叠加：

提示缓存乘数在快速模式定价之上适用
数据驻留乘数在快速模式定价之上适用

快速模式不适用于 Batch API。

更多信息请参见快速模式。

批处理

Batch API 允许异步处理大量请求，输入和输出令牌均享受 50% 折扣。

模型	批处理输入	批处理输出
Claude Opus 4.7	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.6	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.5	$2.50 / MTok	$12.50 / MTok
Claude Opus 4.1	$7.50 / MTok	$37.50 / MTok
Claude Opus 4（已弃用）	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 4.6	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4.5	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4（已弃用）	$1.50 / MTok	$7.50 / MTok
Claude Haiku 4.5	$0.50 / MTok	$2.50 / MTok
Claude Haiku 3.5（已退役，Bedrock 和 Vertex AI 除外）	$0.40 / MTok	$2 / MTok

有关批处理的更多信息，请参见批处理。

长上下文定价

Claude Mythos Preview、Opus 4.7、Opus 4.6 和 Sonnet 4.6 以标准定价包含完整的 1M 令牌上下文窗口。（900k 令牌请求与 9k 令牌请求按相同的每令牌费率计费。）提示缓存和批处理折扣在整个上下文窗口范围内按标准费率适用。

工具使用定价

工具使用请求的定价基于：

发送到模型的输入令牌总数（包括 tools 参数中的）
生成的输出令牌数
对于服务端工具，基于使用的额外定价（例如，网络搜索按每次搜索收费）

客户端工具与其他 Claude API 请求的定价相同，而服务端工具可能会根据其特定使用情况产生额外费用。

工具使用产生的额外令牌来自：

API 请求中的 tools 参数（工具名称、描述和模式）
API 请求和响应中的 tool_use 内容块
API 请求中的 tool_result 内容块

当您使用 tools 时，API 还会自动为模型包含一个启用工具使用的特殊系统提示。每个模型所需的工具使用令牌数量如下所示（不包括上面列出的额外令牌）。请注意，该表假设至少提供了 1 个工具。如果没有提供 tools，则工具选择 none 使用 0 个额外系统提示令牌。

模型	工具选择	工具使用系统提示令牌数
Claude Opus 4.7	`auto`、`none` `any`、`tool`	346 令牌 313 令牌
Claude Opus 4.6	`auto`、`none` `any`、`tool`	346 令牌 313 令牌
Claude Opus 4.5	`auto`、`none` `any`、`tool`	346 令牌 313 令牌
Claude Opus 4.1	`auto`、`none` `any`、`tool`	346 令牌 313 令牌
Claude Opus 4（已弃用）	`auto`、`none` `any`、`tool`	346 令牌 313 令牌
Claude Sonnet 4.6	`auto`、`none` `any`、`tool`	346 令牌 313 令牌
Claude Sonnet 4.5	`auto`、`none` `any`、`tool`	346 令牌 313 令牌
Claude Sonnet 4（已弃用）	`auto`、`none` `any`、`tool`	346 令牌 313 令牌
Claude Haiku 4.5	`auto`、`none` `any`、`tool`	346 令牌 313 令牌
Claude Haiku 3.5（已退役，Bedrock 和 Vertex AI 除外）	`auto`、`none` `any`、`tool`	264 令牌 340 令牌

这些令牌数量会添加到您的正常输入和输出令牌中，以计算请求的总成本。

有关当前的每模型价格，请参阅模型定价部分。

有关工具使用实现和最佳实践的更多信息，请参见工具使用。

特定工具定价

Bash 工具

Bash 工具为您的 API 调用增加 245 个输入令牌。

以下内容会消耗额外令牌：

命令输出（stdout/stderr）
错误消息
大文件内容

有关完整的定价详情，请参见工具使用定价。

代码执行工具

与网络搜索或网络获取一起使用时，代码执行是免费的。 当您的 API 请求中包含 web_search_20260209 或 web_fetch_20260209 时，代码执行工具调用不会产生标准输入和输出令牌成本之外的额外费用。

单独使用时，代码执行按执行时间计费，与令牌使用量分开跟踪：

执行时间最低为 5 分钟
每个组织每月获得 1,550 小时的免费使用
超过 1,550 小时的额外使用按每小时、每容器 $0.05 计费
如果请求中包含文件，即使工具未被调用也会收取执行时间费用，因为文件会预加载到容器上

代码执行使用情况在响应中跟踪：

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 239,
    "server_tool_use": {
      "code_execution_requests": 1
    }
  }
}

文本编辑器工具

文本编辑器工具使用与 Claude 其他工具相同的定价结构。它遵循基于您使用的 Claude 模型的标准输入和输出令牌定价。

除了基础令牌外，文本编辑器工具还需要以下额外输入令牌：

工具	额外输入令牌
`text_editor_20250429`（Claude 4.x）	700 令牌

有关完整的定价详情，请参见工具使用定价。

网络搜索工具

网络搜索使用在令牌使用之外额外收费：

{
  "usage": {
    "input_tokens": 105,
    "output_tokens": 6039,
    "cache_read_input_tokens": 7123,
    "cache_creation_input_tokens": 7345,
    "server_tool_use": {
      "web_search_requests": 1
    }
  }
}

网络搜索在 Claude API 上的定价为每 1,000 次搜索 $10，加上搜索生成内容的标准令牌成本。在对话中检索到的网络搜索结果被计为输入令牌，在单个轮次中执行的搜索迭代和后续对话轮次中都是如此。

每次网络搜索计为一次使用，无论返回的结果数量如何。如果网络搜索期间发生错误，则不会对该次搜索收费。

网络获取工具

网络获取使用没有额外费用，只有标准令牌成本：

{
  "usage": {
    "input_tokens": 25039,
    "output_tokens": 931,
    "cache_read_input_tokens": 0,
    "cache_creation_input_tokens": 0,
    "server_tool_use": {
      "web_fetch_requests": 1
    }
  }
}

网络获取工具在 Claude API 上无额外费用。您只需为成为对话上下文一部分的获取内容支付标准令牌成本。

为防止无意中获取会消耗过多令牌的大型内容，请使用 max_content_tokens 参数根据您的用例和预算考虑设置适当的限制。

典型内容的示例令牌使用量：

平均网页（10 kB）：约 2,500 令牌
大型文档页面（100 kB）：约 25,000 令牌
研究论文 PDF（500 kB）：约 125,000 令牌

计算机使用工具

计算机使用遵循标准工具使用定价。使用计算机使用工具时：

系统提示开销：计算机使用 beta 为系统提示增加 466-499 个令牌

计算机使用工具令牌使用量：

模型	每个工具定义的输入令牌
Claude 4.x 模型	735 令牌

额外令牌消耗：

截图图像（参见视觉定价）
返回给 Claude 的工具执行结果

Note

如果您同时使用 bash 或文本编辑器工具与计算机使用，这些工具有其各自的页面中记录的令牌成本。

Claude Managed Agents 定价

Claude Managed Agents 按两个维度计费：令牌和会话运行时间。

令牌

Claude Managed Agents 会话消耗的所有令牌按模型定价中显示的费率计费。提示缓存乘数同样适用。会话内触发的网络搜索产生标准的每 1,000 次搜索 $10 费用。在 AWS 上的 Claude Platform 上，会话令牌和运行时间费用按标准费率转换为 Claude 消费单元。

以下 Messages API 修饰符不适用于 Claude Managed Agents 会话：

修饰符	为什么不适用
Batch API 折扣	会话是有状态和交互式的。没有批处理模式。
快速模式溢价	推理速度由运行时管理。
数据驻留乘数	`inference_geo` 是 Messages API 请求字段。
云平台定价	在合作伙伴运营的云平台上不可用。

会话运行时间

SKU	费率	计量
会话运行时间	每会话小时 $0.08	`running` 状态持续时间

运行时间精确到毫秒计量，仅在会话状态为 running 时累积。idle（等待您的下一条消息或工具确认）、rescheduling 或 terminated 状态的时间不计入运行时间。

Note

使用 Claude Managed Agents 时，会话运行时间取代了代码执行容器小时计费模型。您不会在会话运行时间之上被单独收取容器小时费用。

示例计算

使用 Claude Opus 4.7 的一小时编码会话，消耗 50,000 个输入令牌和 15,000 个输出令牌：

行项目	计算	成本
输入令牌	50,000 x $5 / 1,000,000	$0.25
输出令牌	15,000 x $25 / 1,000,000	$0.375
会话运行时间	1.0 小时 x $0.08	$0.08
总计		$0.705

如果启用了提示缓存且 40,000 个输入令牌是缓存读取：

行项目	计算	成本
未缓存输入令牌	10,000 x $5 / 1,000,000	$0.05
缓存读取令牌	40,000 x $5 x 0.1 / 1,000,000	$0.02
输出令牌	15,000 x $25 / 1,000,000	$0.375
会话运行时间	1.0 小时 x $0.08	$0.08
总计		$0.525

Note

处理 10,000 个支持工单的示例计算：

每次对话平均约 3,700 个令牌
使用 Claude Haiku 4.5，$1/MTok 输入，$5/MTok 输出
每 10,000 个工单的总成本：约 $37.00

有关此计算的详细说明，请参见客户支持代理指南。

其他定价考虑

成本优化策略

使用 Claude 构建代理时：

使用适当的模型： 简单任务选择 Haiku，大多数生产工作负载选择 Sonnet，最复杂的推理选择 Opus
实现提示缓存： 降低重复上下文的成本
批处理操作： 对非时间敏感的任务使用 Batch API
监控使用模式： 跟踪令牌消耗以识别优化机会

Tip

对于高容量代理应用，请联系企业销售团队获取定制定价安排。

速率限制

速率限制因使用层级而异，影响您可以发出的请求数量：

层级 1： 入门级使用，基本限制
层级 2： 为增长中的应用增加限制
层级 3： 为成熟应用提供更高限制
层级 4： 最大标准限制
企业： 可提供自定义限制

有关详细的速率限制信息，请参见速率限制。

如需更高的速率限制或定制定价安排，联系销售团队。

数量折扣

高使用量用户可能可获得数量折扣。这些是逐案协商的。

标准层级使用模型定价中显示的价格
企业客户可以联系销售获取定制定价
可能提供学术和研究折扣

企业定价

对于有特定需求的企业客户：

自定义速率限制
数量折扣
专属支持
自定义条款

通过 sales@anthropic.com 或 Claude Console 联系销售团队，讨论企业定价选项。

计费和支付

计费基于实际月度使用量
所有支付以美元结算
提供信用卡和发票选项
使用情况跟踪可在 Claude Console 中查看

常见问题

令牌使用量如何计算？

令牌是模型处理的文本片段。粗略估计，1 个令牌大约相当于 4 个英文字符或 0.75 个英文单词。确切数量因语言和内容类型而异。

有免费层级或试用吗？

新用户会收到少量免费额度来测试 API。联系销售了解企业评估的延长试用信息。

折扣如何叠加？

Batch API 和提示缓存折扣可以组合使用。例如，同时使用这两个功能与标准 API 调用相比可以显著节省成本。有关乘数如何交互，请参见提示缓存定价。

接受哪些支付方式？

标准账户接受主要信用卡。企业客户可以安排发票和其他支付方式。

有关定价的其他问题，请联系 support@anthropic.com。