人工智能 · 2025年9月28日 0

阿里云发布AI安全护栏,五大核心能力护航AI安全

9月24日,杭州云栖大会技术主论坛上,阿里云重磅发布AI安全护栏,提供五项核心安全能力,护航AI安全。通过原生安全防护融入AI Agent开发全链路,并持续以AI赋能安全产品智能升级,打造Agentic-SOC安全运营,提升威胁检测与响应效率。

AI安全护栏示意图

在过去一年,AI Agent持续快速发展。在业务流程构建、组件互动与调用中也面临各类安全风险。因此,阿里云在AI Agent开发全链路中原生嵌入安全,从模型基础设施、模型本身和AI应用三层提供全栈防护,使安全无缝融入业务流,提供高效、便捷、低延迟的防护能力。

在基础设施层,云安全中心、云防火墙、IDaaS、数据安全中心、密钥管理服务等产品共同构成全链路防护。今年,云安全中心新增AI-BOM和AI-SPM能力,帮助企业建立云上AI资产管理与安全态势感知,实现从黑箱到透明的资产管理。

在AI模型层,AI安全护栏提供五项能力:内容合规、敏感数据检测、提示词攻击防护、恶意文件/URL防护和数字水印识别,保障输入输出安全、确保内容合规。与开源护栏相比,阿里云的安全护栏具有明显优势。

在AI应用层,Web应用防火墙提供WAAP应用安全防护方案,包括全新LLM-WAF能力,一键集成AI安全护栏,并提升机器人管理、API安全,帮助客户防护AI应用层面临的风险。

AI安全护栏示意图2

在为AI Agent提供全链路安全的同时,AI的快速发展也在反哺安全产品的智能升级。在通义底层模型的支持下,云安全团队构建数十个安全智能体,通过多智能体协同,将AI融入威胁检测、运营、安全认证、内容安全、数据安全等领域,有效提升了安全产品能力。

AI安全护栏示意图3

针对DeepFake挑战,实人认证通过集成通义Qwen-VL模型,相较之前的小模型与专家模型,在人脸识别伪造方面的召回率提升约10%,更有效防范身份伪造。

在内容安全领域,打造内容审核大模型2.0,整合通义Qwen3Guard全系审核模型,支持多模态内容审核,对识别带偏见、暴力恐怖等更隐晦、复杂的违规内容,检测能力提升约30%。

在数据安全领域,覆盖800多种数据类型识别,通过Qwen-Plus模型实现更高精度的语义识别,数据分类准确率提升约35%,尤其在税务登记号、银行卡号等复杂格式识别方面效果显著。

同时,安全智能体与产品的深度融合,显著提升云上运维效率。云威胁检测与响应CTDR今年全面升级,构建Agentic SOC工作流程,通过多源数据接入、智能分析决策、自动化处置与持续优化,形成云威胁分析与响应体系,自动化事件调查成功率从59%提升至74%,显著提高调查与处置效率。

会上,阿里云宣布已有28款云核心产品深度集成云安全能力,将安全能力融入云产品中,降低使用门槛,未来还将扩展集成产品数量。

AI安全护栏示意图4

截至目前,阿里云已与多家企业构建AI基础设施防护、AI模型生态防护等安全方案,在提升防护效果和运营效率方面共同拓展安全智能体的防护边界。未来将继续探索在安全、AI、性能与成本之间的平衡,提供更智能、性价比更高的安全产品。