English
主导航

旧版 API

使用 GPT-5.5

了解有关 GPT-5.5 及 GPT-5 模型系列的最佳实践、功能特性和迁移指南。

简介

GPT-5.5 提升了复杂生产工作流的基准。它非常适合以下场景:编程类用例、重度依赖工具的代理、基于事实的助手、长上下文检索、从产品规格到方案的工作流,以及对执行质量和响应完善度要求极高的面向客户的工作流。

要充分发挥 GPT-5.5 的优势,请将其视为需要针对性调优的全新模型家族,而不是以下模型的直接替代品: gpt-5.2 or gpt-5.4。开始迁移时,请使用全新的基准,而不是照搬旧版提示词堆栈中的所有指令。从能够维持产品契约的最简提示词开始,然后根据代表性示例调整推理力度、详细程度、工具描述和输出格式。

GPT-5.5 支持之前 GPT-5.4 已提供的所有 API 功能,包括 提示缓存, 托管工具, 工具搜索, 压缩,且 phase 对手动重放的助手项的处理。

参阅 GitHub 上的 GPT-5.5 提示词指南 以获取成功提示词模式的示例。

新特性

  • 更高效的推理: 即使推理工作量相同,GPT-5.5 也能以比以往模型更少的推理 token 取得卓越结果。这在复杂、重度依赖工具或多步骤的工作流中尤为实用,因为在这些场景下 token 的节省会产生复利效应。
  • 通过“结果优先”的提示词实现更强的任务执行力: GPT-5.5 更擅长从明确的目标出发,在遵守约束的同时将产品意图转化为具体的下一步操作。请描述预期的结果、成功标准、允许的副作用、证据规则和输出格式。除非确切的执行路径至关重要,否则请避免提供逐步的流程指导。
  • 更强大且更精准的工具使用: GPT-5.5 在庞大的工具池、多步骤服务工作流以及长时间运行的代理任务中表现出色。它在工具选择和参数调用方面往往更加精准。
  • 语气通常更考究,但也可能更直接: 即使减少提示词的辅助搭建,GPT-5.5 也往往能生成更亲切、更具可读性的回答。

行为变更

  1. 推理努力(reasoning effort)现在默认值为 medium: GPT-5.5 默认采用 medium 推理工作量。请将 medium 视为在质量、可靠性、延迟和成本之间取得平衡的推荐起点。对于延迟敏感型工作流,如果工具使用、规划、搜索或多步骤决策依然重要,请在使用 low 之前先评估 none 。当遇到不需要推理或多链工具调用的延迟关键型任务(例如轻量级语音交互、快速信息检索和分类)时,请保留 none 。仅在评估显示出可衡量的质量提升,且该提升足以证明额外的延迟和成本合理时,再提升至 high or xhigh 。请参阅 推理模型文档 以获取有关推荐设置的更多详细信息。

    较高的推理工作量并非总是更好。如果任务包含相互冲突的指令、薄弱的停止标准或开放式的工具访问权限,过高的工作量可能会导致过度思考、不必要的搜索或输出质量下降。仅在评估显示出可衡量的质量提升时才增加工作量。

  2. 图像输入默认会保留更多视觉细节: GPT-5.5 更新了图像输入的默认处理方式,以保留更多视觉细节并提升计算机使用性能。在以下情况时 image_detail 未设置或设置为 auto,该模型现在使用 original 行为:不缩放地保留像素数高达 10,240,000 或长宽达 6,000 像素限制的图像。对于 high,请直接指定该值;它会保留图像而不进行缩放,最高支持 2,500,000 像素或 2,048 像素的尺寸限制。 low 现在侧重于上下文效率,并且对尺寸超过 512 像素限制的图像进行比以往模型更积极的缩放。请参阅 图像与视觉文档.

  3. 改进的指令遵循能力: GPT-5.5 以字面和全面的方式解析提示词,从而在产品需要时支持提供具体、描述性的指令。请明确界定成功标准和停止规则,尤其是对于长时间运行、重度依赖工具或收集证据的工作流。请参阅 编写结果优先的提示词 and 保持适当的特定性.

  4. 默认风格更简洁直接: GPT-5.5 默认倾向于高效、直接和以任务为导向。这对于许多生产工作流非常有用,但面向客户或对话式的体验可能需要明确的人格设定、亲和力、原理解释和格式化指导。请使用 text.verbosity intentionally: medium 为默认设置,而 low 通常是获取简洁响应的更好起点。请参阅 GPT-5.5 提示词指南.

  5. 编码工作流需要更强的编排能力: GPT-5.5 更适合需要规划、工具使用、代码库导航、验证和多步骤执行的复杂编程任务。对于编程代理,请明确说明代码复用、子代理委派、测试预期、验收标准,以及何时应继续执行而非寻求帮助。

迁移快速入门

使用 Codex 自动迁移

Codex 可以借助以下技能应用本指南中推荐的更改: OpenAI 文档技能.

$openai-docs migrate this project to gpt-5.5

要在其他编码代理中使用此技能,请从以下位置下载: OpenAI 技能代码库.

API 和模型参数

  • 将 model slug 更新为 gpt-5.5.
  • 对任何涉及推理、工具调用或多轮对话的用例,请使用 Responses API。
  • reasoning.effort值。使用 low for efficient reasoning, medium 调整至延迟/性能曲线的平衡点, high 适用于需要硬推理且对延迟要求不高的复杂代理任务,以及 xhigh 适用于最困难的异步智能体任务或测试模型智能极限的评估。参见 推理模型文档.
  • 要配置更简明的响应,请设置 text.verbosity to low。在 GPT-5.5 上,这将导致响应比 low GPT-5.4 的冗长度。
  • 对于工具密集型或长时间运行的工作流,请验证您的应用程序能够处理 phase,前言以及助手消息重放处理正确。
  • 在准确性、Token 消耗和端到端延迟方面与其他模型进行基准测试。

提示

  • 说明预期结果和成功标准。
  • 减少或移除详细的逐步流程指导。除非产品有要求,否则让 GPT-5.5 自行选择路径。
  • 尽可能从提示词中移除输出 schema 定义。使用 结构化输出 instead.
  • 优化您的提示词以提升缓存命中率: 静态部分在前,动态部分在后.
  • 移除当前日期。模型已经知道当前的 UTC 日期。
  • 查看并优化您的提示词,遵循 提示 GPT-5.5.

使用推理模型

本指南适用于 GPT-5 系列模型,并且当团队将工作负载迁移至推理模型时值得重新回顾。GPT-5.5 继承了许多最初出现在早期模型中的能力,但如果您是从早期的 GPT-5 模型、GPT-4.1 或 o3 等推理模型迁移过来,这些能力仍然值得回顾。

团队可能会忽略这些功能,因为它们部分存在于 API 配置和编排中,而不是提示词本身。将 Responses API、推理控制、冗长度、结构化输出、提示词缓存、工具设计、托管工具和状态管理结合使用,有助于推理模型提供最佳的智能、可靠性、延迟和成本表现。

  • Responses API: GPT-5.5 在以下环境中效果最佳: Responses API值。使用 previous_response_id 用于多轮状态处理。对于无状态或零数据保留流程,请在每轮传回相关的返回输出项。参见 从先前的响应中传递上下文 for details.
  • 推理力度: 使用 reasoning.effort to choose between low, medium, high, or xhigh, 默认值为 medium,但许多工作负载在 low下即可良好运行。保留 none 适用于低延迟比智能性更重要的使用场景。参见 推理模型 for detailed recommendations.
  • Verbosity: 使用 text.verbosity 以控制输出长度。将最终答案长度与推理质量分开对待;根据需要指定字数预算、章节数量、表格宽度或仅输出 JSON。
  • 结构化输出: 避免在提示词中描述预期的输出 schema。使用 结构化输出 以实现自动验证并提高准确性。
  • 提示词缓存: 提示缓存 会自动适用于符合条件的长提示词,并可以降低延迟和输入 Token 成本。为了最大化缓存命中率,请将稳定内容保留在请求的开头。将动态的、特定于用户的上下文放在末尾。对于具有公共前缀的重复流量,请一致地使用 prompt_cache_key 并跟踪 usage.prompt_tokens_details.cached_tokens.
  • 工具调用: GPT-5.5 支持与 GPT-5.4 相同的工具调用模式,包括函数工具和工具密集型的智能体工作流。将大部分特定于工具的指导放在工具描述本身中:工具的功能、使用时机、所需输入、副作用、重试安全性以及常见错误模式。仅当特定于工具的上下文适用于所有工具或实质性改变智能体的操作策略时,才将其添加到系统指令中。
  • 托管工具和工具搜索: 在适合工作流的地方,优先选择 OpenAI 托管的工具 例如网络搜索、文件搜索、代码解释器、图像生成和计算机使用。托管工具减少了自定义编排的负担,并使常见的工具模式与 Responses API 和 Agents SDK 保持一致。当您需要调用自己的系统、强制执行特定领域的副作用或公开内部业务工作流时,请使用自定义函数工具。对于大型工具目录,请考虑使用 工具搜索 以推迟工具定义,并仅加载相关的子集。
  • 工具前言: 前言可以改善聊天用户体验,因为用户可以在模型生成最终响应之前看到初始的有用状态更新。它们也使工具的使用更容易跟进:模型可以声明它即将检查或执行的操作,然后在工具结果到达后从相同的助手状态继续。
  • phase handling: 如果您的应用程序通过在每轮传回输出项而不是使用 previous_response_id,保留 phase 参数来手动管理 Responses 状态,请保持不变并将其传回。这在使用推理力度、前言或重复工具调用时尤为重要。参见 Phase 参数.
  • Compaction: For long-running agents, use 对话/状态压缩 有意识地进行。保留已完成的操作、当前的假设、ID、工具结果、未解决的阻碍以及下一个具体目标。
  • Agents SDK: 对于新的智能体系统,请使用最新的 Apps SDK 模式来进行工具编排、追踪、移交和状态管理,而不是从头开始重建编排。
  • 当前日期: GPT-5.5 知道 UTC 格式的当前日期。您无需将当前日期添加到系统指令中。仅当应用程序需要特定于业务的时区、政策生效日期、用户本地日期或其他非 UTC 参考点时,才添加明确的日期或时区上下文。