GPT-5.4 mini 模型 | OpenAI API

模型

GPT-5.4 mini

默认值

我们迄今为止最强大的 mini 模型，适用于编码、计算机使用和子智能体

推理

更高

速度

快速

价格

$0.75•$4.5

输入•输出

输入

文本、图像

输出

文本

GPT-5.4 mini 将 GPT-5.4 的优势引入了一款专为高并发工作负载设计的更快速、更高效的模型中。详情请参阅我们的最新模型指南.

400,000 上下文窗口

128,000 最大输出 token

2025 年 8 月 31 日知识截止

支持推理 token

定价

定价基于使用的 token 数量或基于模型类型的其他指标。对于特定工具的模型（如搜索和计算机使用），每次工具调用都会收取费用。详情请参阅中找到.

文本 token

每 1M token

∙

Batch API 价格

输入

$0.75

缓存输入

$0.075

输出

$4.50

快速比较

输入

缓存输入

输出

GPT-5.4

$2.50

GPT-5.4 mini

$0.75

GPT-5.4 nano

$0.20

区域处理（数据驻留）端点对 GPT-5.4 mini 收取 10% 的附加费用。

模态

文本

输入和输出

Image

仅输入

音频

不支持

视频

不支持

端点

Chat Completions

v1/chat/completions

响应

v1/responses

实时

v1/realtime

实时翻译

v1/realtime/translations

实时转录

v1/realtime/transcription_sessions

助手

v1/assistants

Batch

v1/batch

微调

v1/fine-tuning

嵌入

v1/embeddings

图像生成

v1/images/generations

视频

v1/videos

图像编辑

v1/images/edits

语音生成

v1/audio/speech

转录

v1/audio/transcriptions

翻译

v1/audio/translations

审核

v1/moderations

Completions（旧版）

v1/completions

功能

流式传输

支持

函数调用

支持

结构化输出

支持

微调

不支持

工具

此模型在使用 Responses API 时支持的工具。

网络搜索

支持

文件搜索

支持

图像生成

支持

代码解释器

支持

托管 Shell

支持

应用补丁

支持

技能

支持

计算机使用

支持

MCP

支持

工具搜索

支持

快照

快照允许您锁定模型的特定版本，从而保持性能和行为的一致性。以下是所有可用快照及别名的列表： GPT-5.4 mini.

gpt-5.4-mini

gpt-5.4-mini-2026-03-17

速率限制

速率限制通过对特定时间段内的请求数、Token 数、音频时长或其他使用量设置上限，确保对 API 的访问公平且可靠。您的用量等级决定了这些限制的水平，并会随着您发送更多请求和在 API 上的花费增加而自动提升。

层级	RPM	TPM	批处理队列限制
免费	不支持
层级 1	500	500,000	5,000,000
层级 2	5,000	2,000,000	20,000,000
层级 3	5,000	4,000,000	40,000,000
层级 4	10,000	10,000,000	1,000,000,000
等级 5	30,000	180,000,000	15,000,000,000

推荐

入门

核心概念

Apps SDK

工具

运行与扩展

评估

实时与音频

模型优化

专业模型

正式上线

旧版 API

资源

入门指南

使用 Codex

配置

管理

自动化

学习

发布

核心概念

规划

构建

部署

转化应用

指南

资源

指南

文件上传

API

衡量

广告主 API

API 参考

最新

主题

主题

贡献

分类

主题

项目

活动