安全检查 | OpenAI API

我们会对模型及其使用方式运行多种类型的评估。本指南介绍了我们如何进行安全测试以及您可以采取哪些措施来避免违规。

GPT-5 及后续版本的安全分类器

With the introduction of GPT-5，我们添加了一些检查，以发现并阻止访问危险信息。某些用户最终可能会试图将您的应用用于违反 OpenAI 政策的目的，尤其是在用例广泛的应用中。

The safety classifier process

我们会将发往 GPT-5 的请求划分为不同的风险阈值等级。
如果您的组织多次达到高风险阈值，OpenAI 将返回错误并发送警告邮件。
如果此类请求在规定的时间阈值（通常为七天）之后仍在继续，我们将停止您的组织访问 GPT-5 的权限。后续请求将不再生效。

如何避免错误、延迟和封禁

如果您的组织从事违反我们安全政策的可疑活动，我们可能会返回错误、限制模型访问权限，甚至封禁您的帐户。以下安全措施有助于我们识别高风险请求的来源，并封锁个别最终用户，而不是封锁您的整个组织。

提交。适用于个别用户与模型进行交互的产品。建议使用安全标识符，但这并非强制要求。
如果您的用例需要访问限制较少版本的服务，以便在生命科学领域开展有益的应用，请阅读我们的特殊访问计划，看看您是否符合条件。

为个别用户实施安全标识符

The safety_identifier 参数在 Responses API and older Chat Completions API。Realtime API 通过以下方式支持相同的概念： OpenAI-Safety-Identifier 标头中均可使用。要使用安全标识符，请在每次请求时为您的最终用户提供一个稳定的 ID。对用户电子邮件或内部用户 ID 进行哈希处理，以避免传递任何个人信息。

安全标识符不会在 API 或会话之间共享。如果您的应用程序已随 Responses API 请求发送 safety_identifier ，请在创建或连接每个 Realtime 会话时单独传递相同的稳定值。

在 Responses API 中提供安全标识符

python

1
2
3
4
5
6
7
8
from openai import OpenAI
client = OpenAI()

response = client.responses.create(
model="gpt-5.4-mini",
input="This is a test",
safety_identifier="user_123456",
)

1
2
3
4
5
6
7
8
curl https://api.openai.com/v1/responses \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "gpt-5.4-mini",
"input": "This is a test",
"safety_identifier": "user_123456"
}'

在 Chat Completions API 中提供安全标识符

python

1
2
3
4
5
6
7
8
9
10
from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
model="gpt-5.4-mini",
messages=[
{"role": "user", "content": "This is a test"}
],
safety_identifier="user_123456"
)

1
2
3
4
5
6
7
8
9
10
curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "gpt-5.4-mini",
"messages": [
{"role": "user", "content": "This is a test"}
],
"safety_identifier": "user_123456"
}'

在 Realtime API 中提供安全标识符

curl

1
2
3
4
5
6
7
8
9
10
curl https://api.openai.com/v1/realtime/client_secrets \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-H "OpenAI-Safety-Identifier: user_123456" \
-d '{
"session": {
"type": "realtime",
"model": "gpt-realtime-2"
}
}'

潜在后果

如果 OpenAI 监控系统发现潜在的滥用行为，我们可能会采取不同级别的措施：

流式响应延迟
- 作为对潜在违反政策用户的一种初步且后果较轻的干预措施，OpenAI 可能会延迟流式响应，在向该用户返回完整响应之前运行额外的检查。
- 如果检查通过，流式传输即开始。如果检查未通过，请求将停止——不会显示任何 token，流式响应也不会开始。
- 为了提供更好的最终用户体验，建议在流式传输延迟的情况下添加加载动画 (loading spinner)。
封锁个别用户的模型访问权限
- 在确认为严重违反政策的情况下，关联的 safety_identifier 将被完全封锁，无法再访问 OpenAI 模型。
- 该安全标识符在后续所有使用相同标识符的 GPT-5 请求中都会收到 identifier blocked 错误。OpenAI 目前无法解封个别标识符。

为确保此类封锁生效，请保证您已实施相应的控制措施，以防止被封锁的用户直接注册新帐户。再次提醒，如果您的组织发生多次违反政策的行为，可能会导致您的整个组织失去访问权限。

我们这样做的原因

具体的执行标准可能会根据不断变化的实际使用情况或新模型的发布而有所调整。目前，OpenAI 可能会限制或封锁具有风险或可疑生物及化学活动的安全标识符的访问权限。请参阅博客文章以获取有关我们如何应对更高阶 AI 生物学能力的更多信息。

其他类型的安全检查

为了确保您安全使用 OpenAI API 和相关工具，我们会对自有模型（包括所有微调模型）以及计算机使用工具运行安全检查。

了解更多：

推荐

入门

核心概念

Apps SDK

工具

运行与扩展

评估

实时与音频

模型优化

专业模型

正式上线

旧版 API

资源

入门指南

使用 Codex

配置

管理

自动化

学习

发布

核心概念

规划

构建

部署

转化应用

指南

资源

指南

文件上传

API

衡量

广告主 API

API 参考

最新

主题

主题

贡献

分类

主题

项目