English
主导航

旧版 API

gpt-5.4-mini
GPT-5.4 mini
我们迄今为止最强大的 mini 模型,适用于编码、计算机使用和子智能体
推理
速度
价格
$0.75$4.5
输入
输出

GPT-5.4 mini 将 GPT-5.4 的优势引入了一款专为高并发工作负载设计的更快速、更高效的模型中。详情请参阅我们的 最新模型指南.

400,000 上下文窗口
128,000 最大输出 token
2025 年 8 月 31 日知识截止
支持推理 token
定价
定价基于使用的 token 数量或基于模型类型的其他指标。对于特定工具的模型(如搜索和计算机使用),每次工具调用都会收取费用。详情请参阅 中找到.
文本 token
1M token
Batch API 价格
输入
$0.75
缓存输入
$0.075
输出
$4.50
快速比较
输入
缓存输入
输出
GPT-5.4
$2.50
GPT-5.4 mini
$0.75
GPT-5.4 nano
$0.20

区域处理(数据驻留)端点对 GPT-5.4 mini 收取 10% 的附加费用。

模态
文本
输入和输出
Image
仅输入
音频
不支持
视频
不支持
端点
Chat Completions
v1/chat/completions
响应
v1/responses
实时
v1/realtime
实时翻译
v1/realtime/translations
实时转录
v1/realtime/transcription_sessions
助手
v1/assistants
Batch
v1/batch
微调
v1/fine-tuning
嵌入
v1/embeddings
图像生成
v1/images/generations
视频
v1/videos
图像编辑
v1/images/edits
语音生成
v1/audio/speech
转录
v1/audio/transcriptions
翻译
v1/audio/translations
审核
v1/moderations
Completions(旧版)
v1/completions
功能
流式传输
支持
函数调用
支持
结构化输出
支持
微调
不支持
工具
此模型在使用 Responses API 时支持的工具。
网络搜索
支持
文件搜索
支持
图像生成
支持
代码解释器
支持
托管 Shell
支持
应用补丁
支持
技能
支持
计算机使用
支持
MCP
支持
工具搜索
支持
快照
快照允许您锁定模型的特定版本,从而保持性能和行为的一致性。以下是所有可用快照及别名的列表: GPT-5.4 mini.
gpt-5.4-mini
gpt-5.4-mini
gpt-5.4-mini-2026-03-17
gpt-5.4-mini-2026-03-17
速率限制
速率限制通过对特定时间段内的请求数、Token 数、音频时长或其他使用量设置上限,确保对 API 的访问公平且可靠。您的用量等级决定了这些限制的水平,并会随着您发送更多请求和在 API 上的花费增加而自动提升。
层级RPMTPM批处理队列限制
免费不支持
层级 1500500,0005,000,000
层级 25,0002,000,00020,000,000
层级 35,0004,000,00040,000,000
层级 410,00010,000,0001,000,000,000
等级 530,000180,000,00015,000,000,000