openai推出了开源的安全推理模型gpt-oss-safeguard,提供120b与20b两种规模版本,允许开发者根据需求自定义内容审核策略。该模型依据apache 2.0许可协议开放使用,具备高度灵活性和可扩展性。
这两个不同参数量的模型均支持harmony格式的输入输出,并配备低、中、高三档推理强度选项,适用于输入输出过滤、在线内容打标、离线信任与安全审查等特定应用场景,但并不推荐用于通用文本生成任务。

据官方介绍,gpt-oss-safeguard能够直接解析开发者提供的策略文档,通过链式逻辑推理生成审核判断及详细解释,支持多个策略并行执行。在内部测试中,其多策略处理准确率达到52.2%,表现优于GPT-5-Thinking和原始GPT-OSS模型。该模型采用“策略直读+推理解释”架构,无需重新训练即可实现规则动态更新,特别适合应对新型风险、垂直领域应用以及标注数据匮乏的场景。

OpenAI Codex
可以生成十多种编程语言的工作代码,基于 OpenAI GPT-3 的自然语言处理模型
57 查看详情

模型下载地址:https://www.php.cn/link/f047575e706451ca0ed912cf3d11daba
以上就是OpenAI 发布开源安全模型 gpt-oss-safeguard的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/317404.html
微信扫一扫
支付宝扫一扫