被打击得一塌糊涂的安全圈，怎么利用“AI”开启外挂模式？

雷锋网 • 7年前扫码分享

最近阿里工程师很火。

除了穿特步被相亲对象diss的小伙，更有朋友圈刷屏的阿里安全资深专家杭特，吐槽安全圈八大怪象。

“我觉得不止八大，应该有十八大怪象。”说这话的是梆梆安全副总裁付杰，其中让他印象最为深刻的怪象即以攻代防，“在安全行业，谈破解远比谈渗透的多。”

▲付杰

媒体：今日XXX公司发现了某车高危漏洞，利用这一漏洞可以乾坤大挪移想开哪辆车开哪辆。

吃瓜群众：蛤？好可怕，怎么办怎么办？

安全公司：（微笑脸）请及时更新/请注意编码的问题/请静待厂家修复……

吃瓜群众：……

在付杰看来，安全的本质是一攻一防，但防守问题在今天整个信息安全行业中一直处于停滞阶段。

为何是停滞的？

“低垂的果实”已被摘完

在被誉为“下一个弗里德曼”的美国经济学家泰勒·考恩出版的名为《大停滞》的书中，他用“低垂之果”解释近半个世纪以来技术进步的趋缓：人类上一轮技术大爆发，实际上得益于最近四百年内科学上的“范式革命”。如今我们已经将这场“范式革命”相对易得的技术果实基本摘完了，想让技术继续维持高速增长，人类要么需要投入更多成本，爬得更高些去采摘更多果实，要么找一棵新树——让科学再次爆发“范式革命”。

类比安全行业，付杰把信息行业迅速发展、政策红利、频发的安全事件、愈发廉价的资源比作“低垂的果实”，过去几年安全行业依赖这些唾手可得的“果实”发展，但这些果子被摘光了怎么办？

一些需要解决的问题没有取得大的进展，比如司空见惯的薅羊毛、抢票事件一直未能有效制止。甚至还衍生出了一种畸形思维：“依赖白帽黑客通过众测方式寻找漏洞来取代安全防护，这很奇怪。”

找棵新树有点难，要不寻求点“外挂”帮助？比如人工智能、大数据等。

知乎上有个帖子这样形容人工智能，“人工智能是一种技术，但如果其不能找到一种业务场景落地，基本上只能装13。”

把人工智能或大数据当做外挂付之以安全行业，在付杰看来是可行的。尽管目前业内对此多处于半探索状态，离实现真正商用尚需时日，但也在某些尝试中实现了单点突破。

人工智能到底能为安全解决什么？先要退一步看看人工智能能做到什么。

AI＋安全四方面

付杰谈了几个方面。

首先是用机器学习来进行知识关联分析，以及无标签的网络流量分析。

传统分析网络的做法是人工的为每个字段划分标签，这一段是IT，这一段是译码，这一段是金额，有时还需要进行二次编码，之后再进行审计，这一系列的复杂工作都要依靠人力。

要知道，目前在网络安全行业维护一个庞大的协议库工作量巨大，特别在工业物联网领域工作成本更高。但如果用机器学习、监督学习对网络流量做无标签分析，则可以节省许多人力成本。当然这在今天已经可以实现。

另外人工智能还可应用于病毒检测，以及源代码符号化处理等方面。

付杰笑称在这方面他既是参与者也是受害者更是受益者。大概七八年前，他在使用某款专业工具扫描自己的源代码时报出7000多个所谓的问题。

“当时我就懵逼了，因为总共我的源代码才5000多个，这要去改吗？”事实上这7000多个问题可能有6900个是误报。

为何？

这还要从这类工具的原理说起。

这类工具基本依靠的还是特征识别技术，简单理解就是先把众多有问题的源代码摆在那里，然后对你要扫描的源代码进行匹配，尽管不同扫描工具匹配规则可高可低，处理语言的种类可多可少，但最终能发现的多不是漏洞，而是不规范的代码问题。

所有的源代码最后都会被转化成什么？一段标准的符号机器码。如果可以用深度学习、机器学习来处理源代码，将源代码做一个整体进行分析发现其存在的漏洞，远比通过匹配发现的漏洞准确得多。

“好歹程序是标准的，人的语言是不标准的。”

上面几项是将人工智能与安全结合可以走得通的路，那再往下可以做些什么？

下一代应用安全

“回到最开始的问题，如果要构建一套比较安全的业务系统，抛开人的能力问题来讲，我们应该会怎么做？”

开发过程中的源代码漏洞挖掘、测试过程中的程序漏洞及业务逻辑漏洞挖掘、运行过程中的漏洞攻击及业务漏洞利用、运行过程中的欺诈行为识别，曾几何时，这些工作仅能由专业人员完成。

“去给客户审十万个源代码里面的漏洞，经常需要花费大量人力物力，审的昏天暗地。”付杰笑道。

所以梆梆安全计划在明年推出一套新系统，叫下一代应用安全。

为什么叫下一代应用安全？因为梆梆安全不但做了下一代、还做了上一代应用安全。

时间回溯过去的三到五年，梆梆安全的上一代应用安全主要聚焦于移动应用保护技术，基于加密、加壳、混淆、虚拟化等技术手段，阻止恶意攻击者发现移动应用内部的缺陷、漏洞，保护移动应用免遭恶意破解、篡改、二次打包各类攻击。

“也就是过去五年，我们用了各种技术防止别人发现应用内部的安全隐患。但是今天更好的手法是什么？是找出问题，把它彻底解决。”

现在梆梆安全希望构建的下一代安全体系是从静态分析，到动态分析，再到实时防护的完整体系。其与上一代本质的区别就是，无论是静态安全性测试还是动态安全性测试，使用大量的深度学习技术来知道所有的业务流量特征，以此用这种方法构建出所有的可能攻击状况，进而测试应用是否安全。 此处可以想做上帝视角，下一代安全体系就是“天黑不闭眼”的预言家了。 最后，通过对用户的业务学习，来构建业务的实时防御规则。

“整个目标指向的是在静态和动态层面上，挖掘漏洞，并且提供自动的漏洞修复能力。”

此处还有趣事，付杰告诉雷锋网，在下一代安全体系开发出来后，梆梆安全选择了市面上一些知名的开源软件进行扫描，结果竟然发现了一个非常严重的安全漏洞。

付杰告诉雷锋网 (公众号：雷锋网) ，整个过程就是让计算机自己发现自己的问题，人只需要看结果就好。厉害了word机～

被打击得一塌糊涂的安全圈，怎么利用“AI”开启外挂模式？