
在2025年世界互联网大会乌镇峰会上,360数字安全集团正式推出国内首个《大模型安全白皮书》,全面剖析大模型从研发到应用全生命周期中的五大关键安全挑战,并首次提出“外挂式安全 + 平台原生安全”双轨治理模式,为应对高风险AI时代构建多层次防御体系。
该白皮书揭示,大模型面临的安全威胁已演变为跨层级、高度关联的复杂结构,主要体现在以下五个层面:
基础设施层:训练所依赖的算力集群和平台若遭入侵,可能导致模型被植入恶意逻辑或核心参数泄露;内容生成层:模型可能输出虚假信息、违法内容或产生“AI幻觉”,带来舆论误导与社会信任危机;数据与知识层:训练数据存在泄露风险,知识库一旦被篡改或污染,将直接影响模型判断的准确性与可靠性;智能体层(Agent):具备自主调用工具与决策能力的AI代理,若被恶意引导,可能执行非法操作或发起链式攻击;用户交互层:通过提示词注入、权限越界等手段,攻击者可绕过防护机制直接操控模型输出。
针对上述多维度风险,360创新性地提出“双轨并行”的安全防护思路:
豆包大模型
字节跳动自主研发的一系列大型语言模型
834 查看详情
外挂式安全:在大模型系统外围部署独立的安全组件,如内容审查网关、行为监控系统与日志审计平台,实现动态监测与拦截;平台原生安全:将安全机制深度融入模型开发流程,在训练、微调、部署、推理等环节嵌入安全校验,做到“安全即内建”。
依托这一理念,360已建成涵盖数据脱敏处理、模型鲁棒性增强、生成内容过滤、Agent行为追踪、API接口防护、红蓝对抗演练及合规管理在内的七大核心技术能力,形成端到端的大模型安全解决方案,并在金融、制造、政务服务等多个关键领域实现规模化应用。
360指出,个体企业的技术投入难以应对全局性安全挑战。未来将持续联合高校、科研机构与产业伙伴,共同推进大模型安全标准体系建设、威胁情报联动共享机制以及开源安全工具生态建设,致力于构建开放协同、可持续演进的AI安全新生态。
以上就是360 发布《大模型安全白皮书》的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/599128.html
微信扫一扫
支付宝扫一扫