AI程序员「删库跑路」,还撒谎!安恒信息做了一次实验……
作为国内领先的AI安全企业,安恒信息针对该问题开展了一次双层次实验,并且搭建了一套完整的“多智能体(MCPs)协同驱动的自动化安全审计体系”,系统性评估AI代码生成工具在不同条件下的安全表现。







CWE Top 25 和 OWASP Top 10 是国际公认的核心 Web 应用安全风险清单。我们将 AI 生成代码中的漏洞类型与这两大基准对照,如果触发了对应弱点,就视为“不合规”;反之,则合规度越高。
通过统计命中率并转换为排名,可以直观量化不同模型在规避行业标准漏洞方面的表现。表 1、表 2 展示了不同提示词条件下的 CWE / OWASP 合规排名。


表2-不同提示词加入后各模型的OWASP合规排名
综合评分按“安全30% + 合规20% + 代码质量15% + 安全成熟度15% + OWASP10% + CWE10%”计算。

表3-不同提示词加入后各模型的综合排名
结论
AI Coding的安全问题并不是一个简单的技术问题,它需要模型厂商、安全团队以及开发者的持续协同。多智能体审计框架为我们指出了一条切实可行的实践路径,企业级代码的“生成即安全”将在越来越多的场景进行落地。
AI编程只有真正成为可靠的生产力,而非极客工具箱里的玩具,才能够给企业带来生产效率的提升、价值的增量。这场变革才刚刚开始,但每一步探索,都在为更安全的AI Coding未来铺路。
除 AI 编程外,其他网络安全领域也正遭遇AI驱动的攻击升维挑战,倒逼防御范式迎来革命性突破。面对 “以 AI 对抗 AI” 的需求,行业亟需更高效的AI安全服务创新范式。

作为国内唯一以数字贸易为主题的国家级展会,第四届全球数字贸易博览会(以下简称“数贸会”)即将于9月25日 - 29日在杭州大会展中心盛大启幕。安恒信息作为本届数贸会“数字安全技术服务合作伙伴”,将以自主研发的AI+安全产品,为这场聚焦“数字贸易 商通全球”的国际盛会保驾护航。
届时,安恒信息将全球首发集成18年实战沉淀、千名专家经验炼成的“AI安服数字员工”,致力于构建高效智能的新时代数字安全服务体系。这不仅是对谷歌认定的十大AI+应用领域(安全 Agent)的率先落地,更是中国安全治理理念与经验向全球的重要输出。
大会即将开始,欢迎扫码参会













立即体验恒脑3.0 


智能化安全服务
安全托管服务
侦测服务
保护检测服务
监控分析服务
应急服务
运营管理服务









