Claude Opus 4.7 新功能
Claude Opus 4.7 的新功能、破坏性变更和行为变更概述。
Claude Opus 4.7 是我们迄今为止最强大的通用模型。它具有高度自主性,在长期代理工作、知识工作、视觉任务和记忆任务方面表现出色。本页总结了发布时的所有新功能。
新模型
| 模型 | API 模型 ID | 描述 |
|---|---|---|
| Claude Opus 4.7 | claude-opus-4-7 | 我们最强大的通用模型,用于复杂推理和代理编码 |
Claude Opus 4.7 支持 1M 令牌上下文窗口、128k 最大输出令牌、自适应思考,以及与 Claude Opus 4.6 相同的工具和平台功能集。
有关完整的定价和规格,请参见模型概述。
新功能
高分辨率图像支持
Claude Opus 4.7 是我们第一个支持高分辨率图像的 Claude 模型。最大图像分辨率已提高到 2576px / 3.75MP(从之前的 1568px / 1.15MP 限制提高)。此变更应能在视觉密集型工作负载上带来性能提升,对计算机使用和截图/工件/文档理解工作流尤为重要。
此外,像将坐标映射到图像这样的操作现在更简单了——模型的坐标与实际像素是 1:1 的,因此不需要缩放因子计算。
高分辨率图像使用更多令牌。如果不需要额外的图像保真度,请在发送到 Claude 之前对图像进行降采样,以避免令牌使用量增加。
除了分辨率之外,Claude Opus 4.7 还在以下方面有所改进:
- 低级感知 — 指向、测量、计数和类似任务。
- 图像定位 — 自然图像边界框定位和检测得到改进。
详情请参见图像和视觉。
新增 xhigh 努力级别
努力参数允许您调整 Claude 的智能与令牌消耗之间的平衡,以更快的速度和更低的成本换取能力。对于编码和代理用例,从新的 xhigh 努力级别开始,对于大多数对智能敏感的用例,使用 high 努力作为最低级别。有关每个级别的指导,请参见 Claude Opus 4.7 的推荐努力级别。(仅限 Messages API;Claude Managed Agents 自动处理努力级别。)
任务预算(测试版)
Claude Opus 4.7 引入了任务预算。任务预算为 Claude 提供了在完整代理循环中(包括思考、工具调用、工具结果和最终输出)应使用的大致令牌数估计。模型会看到一个倒计时,并用它来优先处理工作并在预算消耗时优雅地完成任务。要使用,请设置 beta 标头 task-budgets-2026-03-13 并在输出配置中添加以下内容:
response = client.beta.messages.create(
model="claude-opus-4-7",
max_tokens=128000,
output_config={
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
},
messages=[
{"role": "user", "content": "Review the codebase and propose a refactor plan."}
],
betas=["task-budgets-2026-03-13"],
)
您可能需要针对您的用例尝试不同的任务预算。如果给模型的任务预算对于给定任务来说限制太大,它可能会不太彻底地完成任务,或者完全拒绝执行任务。
对于质量比速度更重要的开放式代理任务,不要设置任务预算;将任务预算保留用于需要模型将其工作限制在令牌配额内的工作负载。任务预算的最低值为 20k 令牌。
这不是硬性限制;它是模型知道的一个建议。这与 max_tokens 不同,max_tokens 是对每个请求生成令牌的硬性限制(max_tokens 不会传递给模型,模型不知道它),而 task_budget 是整个完整代理循环的建议性上限。当您希望模型自我调节时使用 task_budget,使用 max_tokens 作为硬性上限来限制使用量。
破坏性变更
这些破坏性变更仅适用于 Messages API。如果您使用 Claude Managed Agents,Claude Opus 4.7 没有破坏性 API 变更。
移除扩展思考预算
Claude Opus 4.7 中移除了扩展思考预算。设置 thinking: {"type": "enabled", "budget_tokens": N} 将返回 400 错误。自适应思考是唯一的思考开启模式,在我们的内部评估中它可靠地优于扩展思考。
# 之前(Opus 4.6)
thinking = {"type": "enabled", "budget_tokens": 32000}
# 之后(Opus 4.7)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}
自适应思考在 Claude Opus 4.7 上默认关闭。没有 thinking 字段的请求将在不开启思考的情况下运行。要启用它,请明确设置 thinking: {type: "adaptive"}。
移除采样参数
从 Claude Opus 4.7 开始,将 temperature、top_p 或 top_k 设置为任何非默认值将返回 400 错误。最安全的迁移路径是完全从请求中省略这些参数,并使用提示来引导模型的行为。如果您使用 temperature = 0 来获得确定性,请注意它从未保证过相同的输出。
默认省略思考内容
从 Claude Opus 4.7 开始,默认情况下响应中省略思考内容。思考块仍然出现在响应流中,但除非调用者明确选择加入,否则其 thinking 字段将为空。这是一个静默更改——不会引发错误——响应延迟会略有改善。如果需要推理输出,您可以将 display 设置为 "summarized" 并通过一行更改重新加入:
thinking = {
"type": "adaptive",
"display": "summarized", # 或 "omitted"(默认)
}
如果您的产品向用户流式传输推理内容,新默认值将在输出开始前显示为长时间暂停。设置 "display": "summarized" 以在思考期间恢复可见的进度。
更新的令牌计数
Claude Opus 4.7 使用新的分词器,这有助于提高其在广泛任务上的性能。与之前的模型相比,这个新分词器在处理文本时可能会使用大约 1x 到 1.35x 的令牌(根据内容不同最多增加约 35%),并且 /v1/messages/count_tokens 将为 Claude Opus 4.7 返回与 Claude Opus 4.6 不同的令牌数。Claude Opus 4.7 的令牌效率因工作负载形态而异。提示干预、task_budget 和 effort 可以帮助控制成本并确保适当的令牌使用。请记住,这些控制可能会牺牲模型智能。
我们建议更新您的 max_tokens 参数以提供额外的空间,包括压缩触发器。Claude Opus 4.7 以标准 API 价格提供 1M 上下文窗口,没有长上下文溢价。
能力改进
知识工作
Claude Opus 4.7 在知识工作者任务上显示出显著提升,特别是在模型需要视觉验证其自身输出的场景:
- .docx 红线标注和 .pptx 编辑 — 在生成和自我检查跟踪更改及幻灯片布局方面有所改进。
- 图表和图形分析 — 在使用图像处理库(如 PIL)进行编程工具调用以分析图表和图形(包括像素级数据转录)方面有所改进。
如果现有提示在这些领域有缓解措施(例如,"在返回之前仔细检查幻灯片布局"),请尝试移除该脚手架并重新建立基线。
记忆
Claude Opus 4.7 在编写和使用基于文件系统的记忆方面更好。如果代理跨轮次维护暂存器、笔记文件或结构化记忆存储,该代理应该在记笔记和在未来的任务中利用笔记方面有所改进。要给 Claude 一个托管暂存器而不必自己构建,请使用客户端记忆工具。
视觉
参见上面的高分辨率图像支持。
行为变更
这些不是 API 破坏性变更,但可能需要更新提示。有关完整指导,请参见迁移到 Claude Opus 4.7。
- 更字面地遵循指令,特别是在较低努力级别下。模型不会默默地将一个项目的指令泛化到另一个项目,也不会推断您没有提出的请求。
- 响应长度根据感知的任务复杂度调整,而不是默认到固定的详细程度。
- 默认使用更少的工具调用,更多地使用推理。提高努力级别会增加工具使用。
- 更直接、更有主见的语气,与 Claude Opus 4.6 更温暖的风格相比,更少的验证性措辞和更少的表情符号。
- 更定期的进度更新贯穿整个长代理跟踪。如果您添加了脚手架来强制执行临时状态消息,请尝试移除它。
- 默认生成更少的子代理。 可通过提示进行调整。
- 实时网络安全防护: 涉及禁止或高风险主题的请求可能会被拒绝。对于合法的安全工作,请申请网络验证计划。
迁移指南
有关分步迁移说明和完整迁移清单,请参见迁移到 Claude Opus 4.7。如果您使用 Claude Code 或 Agent SDK,Claude API 技能可以自动将这些迁移步骤应用到您的代码库。