GPT-5.3-Codex 是我们首个被视为具备高网络安全能力的模型 防范框架,这需要额外的安全防护措施。这些措施包括训练模型拒绝明显恶意的请求,例如窃取凭据。
除了安全训练之外,基于自动化分类器的监控器会检测可疑的网络活动信号,并将高风险流量路由至网络能力较弱的模型 (GPT-5.2)。我们预计只有极小一部分流量会受到这些缓解措施的影响,并且我们正在不断改进我们的策略、分类器以及产品内通知。
我们这样做的原因
近几个月来,我们看到模型在网络安全任务上的表现有了显著提升,这让开发人员和安全专家都从中受益。随着我们的模型在漏洞发现等网络安全相关任务上不断进步,我们采取了谨慎的策略:扩大保护范围和执行力度,在支持正当研究的同时,遏制潜在的滥用行为。
网络能力天生具有双重用途。支撑重要防御工作的知识与技能——渗透测试、漏洞研究、大规模扫描、恶意软件分析和威胁情报——同样也可能被用于造成现实世界的危害。
这些能力与技术必须在能够用于提升安全性的场景下保持可用且易于使用。我们的 网络安全可信访问 试点项目使个人和组织能够继续使用模型进行具有潜在高风险的网络活动,而不会受到业务中断的影响。
工作原理
从事网络安全相关工作或类似活动的开发人员和安全专家,其请求可能被自动化检测系统 误判 ,从而作为降级方案被路由至 GPT-5.2。我们预计只有极小一部分流量会受到缓解措施的影响,并且我们正在积极调整我们的策略与分类器。
最新 alpha 版本的 Codex CLI 已包含针对请求被重新路由时的产品内消息提示。该消息提示将在未来几天内支持所有客户端。
受缓解措施影响的账户可通过加入 可信访问 下面的程序。
我们认识到加入 Trusted Access 可能并不适合所有人,因此随着我们逐步扩展这些缓解措施并 增强 网络弹性,我们计划在大多数情况下将账户级别的安全检查转变为请求级别的检查。
网络安全可信访问
我们正在试运行“Trusted Access”,它允许开发者保留高级功能,同时我们继续为正式发布(GA)调整策略和分类器。我们的目标是让极少数用户需要加入 网络安全可信访问.
要将模型用于潜在的高风险网络安全工作:
- 用户可以在以下网址验证其身份 chatgpt.com/cyber
- 企业可以申请 受信任的访问权限 默认情况下通过其 OpenAI 代表为其整个团队获取
可能需要访问更强大的网络能力或更宽松模型以加速合法防御工作的安全研究人员和团队,可以表达对我们 仅限受邀者参与的计划的兴趣。受信任访问用户仍必须遵守我们的 使用政策 and 使用条款.
误报
合法的或非网络安全活动有时可能会被标记。发生重定向时,响应模型将在 API 请求日志以及 CLI 的产品内通知中可见,不久将支持所有界面。如果您遇到了认为不正确的重定向,请通过以下方式报告 /feedback for false positives.