想知道人工智能还能干什么?需要有个清醒的“贝叶斯意识”!
有很多读者在跟我们交流时,都会提到非常惊讶于人工智能居然可以做这么多令人意想不到的事。从下围棋到自动驾驶,从辨识古文字到宇宙测绘,似乎有点无所不能的意思。也有读者希望我们做个专题,专门列一个“你想不到AI居然可以做这些”的清单。
非常非常不好意思,我可以非常负责任的说,这清单太容易了,但问题是根本列不完。即使不考虑技术的可能性,仅仅是每天统计新的论文和研究报告里又让AI能做什么了,那都是个近乎无法完成的工作。
但这并不是说AI已经无所不能。事实上,AI在绝大多数基础工作中并没有传统计算机效率高,完全谈不上取而代之。AI总能在意想不到的领域冒出来,是因为它采取了完全不同的底层策略,专注于解决那些经典计算和人工无法解决的问题。
所谓鱼不如渔,与其大家一起感叹“AI居然能做这个!”不如来思考“如何知道AI还能做哪些”。想要获得这个能力,就需要知道今天主流AI解决方案的依据是什么。这就不得不提一个对AI发展至关重要的名字:贝叶斯。
想要寻找上帝,却找到了人工智能
假如没有贝叶斯他老人家,实在很难想象今天的人工智能会怎样。也不仅是人工智能,可能统计学、应用数学、测绘学、医学,甚至犯罪学都会受到巨大的影响。
但对学术如此重要的一个人,却根本不是一位科学家。生活在300年前的托马斯·贝叶斯,是英国的一名牧师。当然,同时还是一位业余数学家。
可能是出于把爱好和工作融合到一起的考虑吧。贝叶斯提出了将归纳法应用于概率统计的方法,希望能以此向世人证明上帝是存在的。但很不幸,三百年之后上帝存在的依据依然未找到,但贝叶斯决策却在无数科学领域开花结果。
所谓贝叶斯归纳,其实基础原理非常简单。比如说一个人做了一件好事,那他是不是个好人呢?显然不一定。但是假如一个人每天都做好事,那他是不是一个好人呢?其实也不一定,也可能他在背后十恶不赦丧尽天良,但假如没有他做坏事的证据,每天做好事就是好人显然已经概率非常大了。这就是贝叶斯归纳的核心逻辑:不必获取所有证据之后再进行判断,而是结合已知条件先进行判断,再通过数据不断去验证、调整、修改这个判断,让它无尽趋于合理化。
这个逻辑听起来蛮简单的,并且好像还有点不靠谱,在贝叶斯生前他的想法甚至没有发表出来。即使其死后的两百多年里,贝叶斯归纳也没有得到多少重视。因为从数据严谨性出发的经典统计学显然可以更好的接触事物本质,而不是像贝叶斯归纳一样用“猜”来开启计算。
直到上世纪七八十年代之后,沉寂百多年的贝叶斯理论开始重新在统计学中被重视。
因为经典统计学虽然可靠,但是却需要依靠完整的数据模型,往往效率太低,无法满足实际需求。比如说在搜寻海面遇难船只时,经典统计学需要每个海域的气象数据、监控数据、过往船只数据,然后综合计算这些因素来精准定位。但事实上,这些数据是不可能马上齐全的,即使可以,分秒必争的搜救工作也不能等。而用贝叶斯理论来解决这个问题,会先让有经验的专家主观判断船只失事海域,然后通过不断获得的数据一点点修正专家的判断,争取在最短时间内解决问题——这就是著名的1968年美国天蝎号潜艇失事事件,也是贝叶斯理论进入应用化的标志。
贝叶斯理论在工作中强调从人类先验知识出发,对目标进行模糊判断,然后不断学习进行判断校对,这成为了后来大量人工智能技术的诞生起点。
300年前,本来希望用来证明上帝存在的理论,在300年后却成为了人工智能的基础,这是一个悲伤的故事呢?
还是说贝叶斯牧师其实已经找到了正确答案?
贝叶斯意识:一切学习型AI的基础
与0和1组成的经典计算不同,贝叶斯计算不需要建立在完整的数据基础上就能获得答案。这种不完全数据推理能力,与人类思维中的认知与判断过程非常相似。于是产生了数量众多的贝叶斯理论与AI结合,运用于不完全信息推导的技术模型。
比如说贝叶斯网络、贝叶斯分类器、贝叶斯逻辑,都是如今非常基础的AI工具。贝叶斯网络更是可以看做机器学习理论自证有效的基础条件。而贝叶斯方法也被广泛运用在NLP、机器视觉、知识图谱等领域,成为优化结果型算法与技术的支撑。
在我们的生活中,贝叶斯可谓无处不在。比如说有没有感觉你的手机拍视频或者直播正在越来越清晰?这其中很大一个原因在于摄像算法中运用了贝叶斯逻辑加持下的视频优化算法,通过对抗生成来获得更清晰自然的拍摄效果,也就是所谓的视频美颜。
从另一个角度也可以论证贝叶斯对人工智能的重要性。上世纪70年代,曾经有过一次比较短暂的AI复兴。当时知识表示和专家系统成为了人工智能的主角,人们希望用超级计算机来归纳人类的所有知识,进行网络化。最终所有问题都可以在其中找到答案。
这种模式在当时赢得了大量资金与关注,却在短短几年间宣告破产。因为人类知识和数据太复杂了,收集所有知识只具有理论上的可能性,现实 操作 遥遥无期。
而今天以机器学习为主要特征的AI二次复兴,很大程度收益于贝叶斯意识带来的思维转变:人类不用收集一大堆知识,只需要从一部分已有知识出发,让机器不断去学习和验证自身能力,不断提高就可以了。毕竟人类需要的不是全能全知的存在,只要智能体可以比人类更强就够了。
可以说,贝叶斯意识依靠着对现实变化的高度敏感,已经成为今天一切学习型AI的基础。了解了贝叶斯意识中从不完整出发,逐步向完整迈进的逻辑,也就懂了未来AI还能做出什么。
人类大脑和技术未来的殊途同归
有学者认为,贝叶斯意识可能是最接近人类大脑思维模式的应用数学逻辑。就像让一个孩子去认识狗,不必教他狗的种类、科属、习性,也用把狗的耳朵、鼻子、四肢都变成数据让他理解。孩子会马上知道这是狗,然后在自己不断的学习里去加强对狗的认识,知道狗有不同种类,知道狼与狗的区别等等。
所以我们过去在思考很多问题时,会主动的让大脑像计算机一样去想象。在移动互联网时代,我们又习惯了以手机为中心去思考一切。但在人工智能时代,贝叶斯意识告诉我们:也许人类该像人类自己一样去思考了。
在某些技术奇点之后,机器已经可以在局部区域像人类一样通过局部知识去认知、推理和判断复杂问题。最好的例子可能就是AlphaGo ZERO的出现。其实AlphaGo的逻辑就是一种贝叶斯思维,要知道对围棋来说经典计算是无法穷尽所有变化的,暴力穷举只能带来死机。
而AlphaGo采取的,是让智能体去学习围棋规则,然后大量学习人类棋谱,这就是贝叶斯归纳中不断吸收数据校准目标。在实战的时候,智能体内部算法还会自我验证每一步预测的合理性,最终求得最优解。
而在一定的积累后,AlphaGo这个贝叶斯体系就可以不再依赖人类提供的数据,而是通过对优质数据进行自我学习,从而在短时间内产生了秒杀上一代的能力。这可以看做贝叶斯体系拜托了对初级数据的依赖,进入了进一步自我校准的过程。
有理由相信,此后这类现象会陆续出现更多。因为人脑的学习能力有若干限制,但贝叶斯智能体却没有。
通过模糊知识,进行不断学习,最终通往广义未知。很可能是人脑与技术未来的共同方向。至少目前来看,这种技术逻辑在前瞻性科学中的应用已经越来越多。比如量子贝叶斯、贝叶斯基因算法等等。
而另一方面,想知道人工智能还能在哪些领域做出惊人之举。不妨也像贝叶斯一样去思考:首先这个领域是否存在效率、可靠性、成本比率、盲目性等问题,如果有的话是否必要引入AI。其次看一下这个领域是不是存在先验知识,作为智能体的基础。再次看一下这个领域能否源源不断产生提供给机器学习的数据和知识。
如果这几个条件都确立,那么AI已经不远了。
经过PC到手机的漫长教化,我们可能已经习惯了数字化的世界运行。但人工智能却可能打破人与计算机的经典搭配,利用人的感知与学习能力和计算机的运算能力来打开另一条路。也许已经是时候改变一下互联网思维,让大脑去和人工智能产生多一点点默契了。