网络安全 – Codex | OpenAI 开发者

GPT-5.3-Codex 是我们首个被视为具备高网络安全能力的模型防范框架,这需要额外的安全防护措施。这些措施包括训练模型拒绝明显恶意的请求,例如窃取凭据。

除了安全训练之外，基于自动化分类器的监控器会检测可疑的网络活动信号，并将高风险流量路由至网络能力较弱的模型 (GPT-5.2)。我们预计只有极小一部分流量会受到这些缓解措施的影响，并且我们正在不断改进我们的策略、分类器以及产品内通知。

我们这样做的原因

近几个月来，我们看到模型在网络安全任务上的表现有了显著提升，这让开发人员和安全专家都从中受益。随着我们的模型在漏洞发现等网络安全相关任务上不断进步，我们采取了谨慎的策略：扩大保护范围和执行力度，在支持正当研究的同时，遏制潜在的滥用行为。

网络能力天生具有双重用途。支撑重要防御工作的知识与技能——渗透测试、漏洞研究、大规模扫描、恶意软件分析和威胁情报——同样也可能被用于造成现实世界的危害。

这些能力与技术必须在能够用于提升安全性的场景下保持可用且易于使用。我们的网络安全可信访问试点项目使个人和组织能够继续使用模型进行具有潜在高风险的网络活动，而不会受到业务中断的影响。

工作原理

从事网络安全相关工作或类似活动的开发人员和安全专家，其请求可能被自动化检测系统误判，从而作为降级方案被路由至 GPT-5.2。我们预计只有极小一部分流量会受到缓解措施的影响，并且我们正在积极调整我们的策略与分类器。

最新 alpha 版本的 Codex CLI 已包含针对请求被重新路由时的产品内消息提示。该消息提示将在未来几天内支持所有客户端。

受缓解措施影响的账户可通过加入可信访问下面的程序。

我们认识到加入 Trusted Access 可能并不适合所有人，因此随着我们逐步扩展这些缓解措施并增强网络弹性，我们计划在大多数情况下将账户级别的安全检查转变为请求级别的检查。

网络安全可信访问

我们正在试运行“Trusted Access”，它允许开发者保留高级功能，同时我们继续为正式发布（GA）调整策略和分类器。我们的目标是让极少数用户需要加入网络安全可信访问.

要将模型用于潜在的高风险网络安全工作：

用户可以在以下网址验证其身份 chatgpt.com/cyber
企业可以申请受信任的访问权限默认情况下通过其 OpenAI 代表为其整个团队获取

可能需要访问更强大的网络能力或更宽松模型以加速合法防御工作的安全研究人员和团队，可以表达对我们仅限受邀者参与的计划的兴趣⁠。受信任访问用户仍必须遵守我们的使用政策⁠ and 使用条款⁠.

误报

合法的或非网络安全活动有时可能会被标记。发生重定向时，响应模型将在 API 请求日志以及 CLI 的产品内通知中可见，不久将支持所有界面。如果您遇到了认为不正确的重定向，请通过以下方式报告 /feedback for false positives.

推荐

入门

核心概念

Apps SDK

工具

运行与扩展

评估

实时与音频

模型优化

专业模型

正式上线

旧版 API

资源

入门指南

使用 Codex

配置

管理

自动化

学习

发布

核心概念

规划

构建

部署

转化应用

指南

资源

指南

文件上传

API

衡量

广告主 API

API 参考

最新

主题

主题

贡献

分类

主题

项目

活动

我们这样做的原因

工作原理

网络安全可信访问

误报