从AlphaGo 围棋大战到AI 德扑大战的机器学习技术解析
文 | 章诚 肖群稀 王宗超
回顾与解析: AlphaGo 横扫世界棋坛, 德州扑克成为人工智能新战场
过去一年中谷歌 AlphaGo 大胜围棋顶级大师李世石, 60 局连胜数十位中日韩围棋高手。 攻陷围棋后人工智能进军德扑对战, 加拿大和捷克科学家研发的 DeepStack 成为首个一对一无限注德扑中战胜人类玩家的人工智能,平均胜率达到了 492mbb/g。 2017 年 1 月中旬卡内基梅隆大学人工智能“ Libratus” 迎战德扑职业玩家,为期 20 天,“人机对战” 历史将再添浓重一笔。人工智能时代的到来震撼全球,究竟是什么力量赋予谷歌 AlphaGo和德扑对战 AI 以超凡智慧? “未来机器”系列报告希望用前瞻性研究视角为您提供启发。 第十五篇,我们聚焦 AlphaGo 的制胜法宝——机器学习。
机器学习是人工智能的方法,深度学习是机器学习的分支
通俗而言,人工智能( Artificial Intelligence)目的就是使机器具备部分(甚至是全部)人类的智能。机器学习是人工智能范畴下的一种重要方法,是实现人工智能的一种途径。深度学习则是指机器通过深度神经网络,模拟人脑进行学习、判断和决策,是机器学习的主要分支之一。人工智能,机器学习和深度学习是层层细分的关系,后者是前者实现的一种途径。机器学习的关键技术支持:内存、 GPU、算法和数据源单来说机器学习就是计算机利用已有数据,得出了某种模型并利用此模预测未来的一种方法,与人脑思考方式非常类似。
机器学习的发展主要决于硬件和软件两个方面。 硬件方面: 大容量的存储是机器学习发展的基础,同时现阶段主流机器学习方法都依赖于 GPU 来进行计算和训练。 软件方面:算法是机器计算的核心, 数据源是机器学习准确性的保障, 随着深度学习算法的提出,神经网络算法成为了近期的热点。
机器学习产业蓬勃发展,全球多领域巨头争相布局
根据 Venture Scanner 统计,截至 2016 年上半年全球共有约 1000 家人工智能公司,其中机器学习相关公司约占 40%;根据 IDC 的预测, 2020 年机器学习应用市场有望达 400 亿美元。 虽然多数人工智能企业尚属初创,但仍有以谷歌、 IBM、 Facebook、百度、阿里巴巴、腾讯等国内外巨头依托自身技术、资金与数据优势构成了机器学习领域的核心力量,从日渐完善产品线到平台构建等角度带动机器学习产业蓬勃发展。
人工智能是智能机器人的点睛之笔, 携手云计算开启服务机器人新时代
服务机器人定位于服务人类,智能化是其最大的特征。 机器学习、深度学习将成为服务机器人高度智慧的新源泉,使机器智能化持续提升,交互准确性迭代提高。 同时云计算、大数据、高速移动网络将机器学习与智能机器人隔空相连, 共同构建以“云平台”为核心的人工智能技术生态圈, 智能机器人有望迎来爆发期。 虽然国内服务机器人产业起步晚, 但发展空间较大, 几十家上市公司宣布进入,其中布局积极、业务规模可观的代表企业包括: 巨星科技、机器人、康力电梯、博实股份、美的集团等。
人机大战烽火不断,人工智能捷报频传
长久以来,“人机对战”一直都被公认为用于衡量人工智能进步程度的重要途径之一。在过去的 20 年里, 随着人工智能的不断发展,传统智力游戏领域不断涌现出新的挑战者,我们多次见证了人工智能已经在大量的游戏、竞技比赛中超越了人类, 例如国际象棋、 中国象棋、 西洋双陆棋、跳棋、 Jeopardy 智力竞赛、 Atari 电子游戏等。 在过去的一年里,人工智能再一次凭借 “人机大战”竞技场上的良好表现引发了全球对人工智能的持续关注。
连胜 60 局:谷歌 AlphaGo 横扫中日韩棋坛
在刚刚过去的 2016 年里,谷歌旗下 DeepMind 公司研发的人工智能 AlphaGo 在围棋界引起波澜。2016 年 1 月 27 日,谷歌 DeepMind 依托“深度学习”原理打造的 lphaGo 在没有让子的情况下战胜了欧洲职业二段选手樊麾,人工智能第一次在完整的围棋竞技中击败专业选手。
成功战胜围棋大师李世石使谷歌 AlphaGo 一战成名。 李世石于 2003 年获第 16 届富士通杯冠军后升为九段棋手, 加冕富士通杯以来在十年时间里共获得 18 个世界冠军, 是继李昌镐之后韩国最具代表性的顶尖棋手。在与李世石对局前, 谷歌 AlphaGo 已经集中学习半年,谷歌为其输入了 3000 万步人类围棋大师的走法,让其自我对弈 3000 万局,积累胜负经验,同时在自我对弈的训练中形成全局观,并对局面做出评估。 2016 年 3 月 9 日到 15 日, AlphaGo 最终于以 4: 1 的总比分战胜了世界围棋冠军李世石, 这表明 AlphaGo在围棋领域已经达到超越了世界顶尖水平。
成名后的 AlphaGo 凭借 60 局连胜中日韩高手再度引发全球关注。 力克李世石后,谷歌AlphaGo 并没有停下它征战的步伐。 2016 年 7 月 18 日,世界围棋排名网站 Go Ratings公布谷歌 AlphaGo 的总积分超过原排名第一的柯洁, 人工智能首次在围棋领域荣登世界榜首。 在 2016 年末至 2017 年初, 谷歌 AlphaGo 化身棋手 Master 在网络围棋平台的快棋对决中多次击败了包括聂卫平、柯洁、朴廷桓、井山裕太在内的数十位中日韩围棋高手,拿下 60 局全胜的战绩,人工智能的杰作谷歌 AlphaGo 在围棋界已经登峰造极。
力克职业玩家: 德州扑克成为人工智能挑战人类的新战场
在攻陷围棋之后,人工智能的触角开始伸向德州扑克。 2017 年初,加拿大和捷克的几位科学家在《 DeepStack:无限注德扑的专业级人工智能玩家》的论文中介绍了 DeepStack这种能在一对一无限注德扑中击败人类玩家的新算法,奠定了人工智能征战德扑的里程碑。论文记录的人机对战中, DeepStack 平均胜率达到了 492mbb/g。 研究者邀请了来自 17个国家的 33 名专业扑克选手挑战 DeepStack,进行了 44852 次较量。 DeepStack 成为了首个在一对一无限注德扑中战胜人类玩家的人工智能,并且平均胜率达到了 492mbb/g (一般人类玩家到 50 mbb/g 就被认为拥有较大优势, 750mbb/g 就是对手每局都弃牌的赢率)。
围棋被攻陷后,为何是德州扑克来承载人类应战的责任?
“人心不可测”的德州扑克是典型的不完整信息博弈游戏,也是人工智能面临的长期挑战。围棋对弈,双方的棋子都尽显在一方棋盘中,也就是“完整信息博弈”,因此阿尔法狗的胜利,实质上就是揭开了围棋玄而又玄的神秘面纱,证实了围棋背后的计算本质。 然而,德州扑克则是“不完整信息博弈”,信息不完全透明,玩家只看得到自己手中的牌,无法得知对手的牌,并在博弈过程中包含了欺骗、推测。简单来说,这是一个“人心不可测”的博弈。 由于德州扑克包含了更接近真实世界情况的欺骗、推测等非完美信息, 这一特征对人工智能的算法和数据处理能力提出了更高的要求。
DeepStack 力挫专业德扑选手的奥秘究竟如何? 人工智能已经读懂人心了吗?
德扑对战中你不仅要思考别人要做什么,思考自己做什么,甚至要思考别人会认为你做什么,进而推理出自己的下一步,这些尔虞我诈的战术更像是兵法。DeepStack 注重培养人工智能德扑对战出牌时的“直觉、牌感”。 在这篇论文中,多次出现一个词:“直觉”,也就是我们常说的“牌感”。 DeepStack 结合循环推理来处理信息不对称,使用分解将计算集中在相关的决策上,并且使用一种深度学习技术从单人游戏中自动学习以获取对扑克任意状态的直觉形式。 在运用深度学习,反复自我博弈之后,DeepStack 学会了在每一个具体情境出现时进行推理。这非常接近人类玩家的“牌感”,即在当前情境下对个人牌面大小的感觉,并作出相应的决策。
对战超过一定手牌数时, 运气成分将被稀释, 人工智能强大的记忆力优势将被突显。 不同于围棋、国际象棋等纯技术类游戏,德州扑克短期的对局中运气因素十分重要。人类完全靠记忆记录对手逻辑思维顺序,还有打牌的模式套路,而人工智能会直接存档,把你每一手牌的牌和过程全部记录下来,客观上这一点人类就比较难做到。所以在一个较长手牌数的对局中,人工智能将数据充分收集并快速分析后,人类完全难以与之抗衡。
下一场人机德扑大战,何时揭晓战果?
2017 年 1 月 11 日, 由卡内基梅隆大学开发的同样适用 DeepStack 算法的人工智能“ Libratus” 开始在无限制德州扑克比赛中同四个顶级德扑职业玩家展开挑战, 赛程为期20 天,总共将对战 12 万手牌, 一旦最终战果揭晓,人工智能征战“人机对战”的历史将再添浓重一笔。
不论是 AlphaGo 在围棋界连奏凯歌还是 Libratus 向德州扑克领域全力进发, 都展现了近年来人工智能, 特别是机器学习领域的迅猛发展。 通过本文,我们将为您深度解读“机器学习”技术的前世今生。
机器学习: 人工智能的璀璨明珠
机器学习是人工智能的方法,深度学习是机器学习的分支
通俗而言,人工智能( Artificial Intelligence) 目的就是使机器具备部分( 甚至是全部)人类的智能。 人工智能作为计算机科学的一个分支,是研究用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科。 美国麻省理工学院的温斯顿教授认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。” 人工智能的研究领域主要包括机器人、语言识别、图像识别、自然语言处理和专家系统等。机器学习是人工智能范畴下的一种重要方法,是实现人工智能的一种途径。 人工智能可以根据其智能的程度分为响应式机器、有限记忆机器,心智理论机器和自我意识机器四类。
前文提到的 AlphaGo 就可以归类为有限记忆机器,即机器可以根据过去有钱的经验来决定未来的步骤。为了实现机器智能的提升,“机器学习”是不可或缺的方法。 根据英特尔机器学习主管尼迪·查普尔( Nidhi Chappel)的观点,人工智能的根本在于如何为机器赋予智能。而机器学习则是部署支持人工智能的计算方法。通俗来说,机器学习是让机器实现智能的方法, 是机器学习成就了人工智能。 机器学习是近期人工智能中发展最快的部分,因此全球为数众多的企业都在努力开发这项技术。
深度学习是指机器通过深度神经网络,模拟人脑进行学习、判断和决策,是机器学习的主要分支之一。 为了达到机器学习的目标,浅层学习和深度学习的方法被先后提出。 深度学习的概念源于人工神经网络的研究,它基于神经网络框架,通过模拟人脑学习的方式的来处理数据,通过神经网络的分层处理,将低层特征组合形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
AlphaGo 的技术架构采用的是模仿人类大脑神经的模式,通过深度学习把人工神经网络的层级大大增加,提升了计算能力。 AlphaGo 的胜利,让如今高速发展的深度学习益发成为人工智能领域的焦点。总的说来,人工智能,机器学习和深度学习是层层细分的关系,后者是前者实现的一种途径。
七十年变迁:机器学习的前世今生
奠定基础: 20 世纪 50 年代初到 60 年代中叶
在这一阶段,研究者们提出的各种算法模型为机器学习奠定了理论基础。 Hebb 于 1949年基于神经心理学的学习机制提出了 Hebb 学习规则。 Hebb 学习规则是一个无监督学习规则,这种学习的结果是使网络能够提取训练集的统计特性,从而把输入信息按照它们的相似性程度划分为若干类。这一点与人类观察和认识世界的过程非常吻合,人类观察和认识世界在相当程度上就是在根据事物的统计特征进行分类。 之后, IBM 科学家亚瑟·塞缪尔开发了一个能够随着游戏程序运行时间的增加而提高行动准确性的跳棋程序。
通过这个程序,塞缪尔驳倒了普罗维登斯提出的机器无法超越人类,像人类一样写代码和学习的模式。他创造了“机器学习”,并将它定义为“可以提供计算机能力而无需显式编程的研究领域”。 此外,在算法方面,最小二乘法和最近领算法的提出大大增强了机器的数据处理能力。
停滞不前: 20 世纪 60 年代中叶到 70 年代末
在这一阶段,受限于当时有限的内存和处理速度,机器学习的发展步伐几乎处于停滞状态。虽然这个时期温斯顿( Winston) 的结构学习系统和海斯·罗思( Hayes Roth) 等的基于逻辑的归纳学习系统取得较大的进展,但只能学习单一概念,而且未能投入实际应用。此外,神经网络学习机因理论缺陷未能达到预期效果而转入低潮。
走向复兴: 20 世纪 70 年代末到 80 年代中叶
从 70 年代末开始,人们从学习单个概念扩展到学习多个概念,探索不同的学习策略和各种学习方法。 这个时期,机器学习在大量的时间应用中回到人们的视线,又慢慢复苏。在这个时期中,韦博斯提出神经网络反向传播算法和多层感知器的概念;昆兰提出了与神经网络模型截然不同的决策树算法。这些新的理论为机器学习的发展增加了更多的可能性。
逐步成形: 20 世纪 90 年初到 21 世纪初
在这阶段, 一些相对成熟的算法理论被提出。 研究者 Schapire 和 Freund 提出并完善了一种用来提高弱分类算法准确度的“ Boosting” 方法; 瓦普尼克和科尔特斯在大量论证和实证的条件下提出了支持向量理论。此外,布雷曼博士进一步深化了决策树模型,提出了随机森林模型。这个阶段,神经网络和支持向量机制在各个情景下存在各自的优势。
蓬勃发展: 21 世纪初至今
在这个时期,深度学习和支持向量机理论成为主流。 Hinton 和 Salakhutdinov 提出的深度学习理论大大提高了神经网络的能力。 深度学习可以让那些拥有多个处理层的计算模型来学习具有多层次抽象的数据的表示。这些方法在许多方面都带来了显著的改善,包括最先进的语音识别、视觉对象识别、对象检测和许多其它领域,例如药物发现和基因组学等。
深度学习能够发现大数据中的复杂结构, 这也是 AlphaGo 能够在围棋领域产生重大影响的原因。 此外,互联网的普及,大数据和云计算的普遍运用也加速了机器学习的发展。 随着机器学习理论的不断演进和发展,人工智能领域也将产生持续的变革,引发人类生产能力和生产方式的改变。
高效性与普适性是机器学习崛起的核心优势
核心优势之一: 高效性
相对于传统的机器算法, 让机器进行一个决策需要其创建者将已有或者已总结好的知识通过机器语言传输给机器。但机器学习的算法能够通过过去相关事件的数据自己总结出相关模型,然后根据总结出的模型对新的事件进行判断,机器的使用者只需要提供过去发生的样本数据。样品量越大,机器决策的正确性就越高。 这就大大提高了效率,因为机器能够24 小时不间断运行去分析样本,而人类则不行。
核心优势之二: 普适性
如果用传统算法去解决一个问题, 遇到不同的条件可能就需要对模型的代码进行调整,这使得改进的成本很高。 而机器学习只需要调整输入的样本数据就能让机器自己分析出新的模型从而进行运用,所需要的只是获得数据的成本和一定的时间成本。这一特性也是的机器学习能够适用于各个能够获得大量数据的行业,而不是只针对某个特殊的方面。大大增强了机器的普适性,继而降低了使用者的成本。
机器学习的主要应用概览
应用之一: 语音识别
机器学习技术可以应用于语音识别领域, iPhone 的 Siri 和 Windows 语音助手 Cortana都使用了机器学习的技术。 当用户使用语音识别软件时, 机器需要根据已经构建的状态网络中寻找与客户声音最匹配的路径, 而这个状态网络的构建就用到了机器学习的技术。通过状态网络的构建,机器可以从一个用户的话语,确定用户提出的具体要求,甚至可以帮助程序自动填充用户需求。机器对客户的声音样本收集的越多,机器对于客户就越人性化。随着机器学习技术的不断发展,语音识别的错误率也在不断减少。
应用之二:人脸识别
人脸识别技术是基于人的脸部特征,对输入的人脸图像或者视频流,根据具体的面貌特征信息进行判断。 人脸识别系统的研究始于 20 世纪 60 年代,而真正进入初级的应用阶段则在 90 年后期,以美国、德国和日本的技术实现为主。 采用深度学习的人脸识别系统,早期需要把现实的图像抽象成一系列数据进行学习并了解人脸的特征,在构建了一套最基本的人工智能学习算法后, 再提供大量人脸及非人脸照片,包括同样的人脸在不同光线、表情、角度的照片,让计算机去适应辨别、学习。人脸识别技术作为技术安全度较高的识别模式,目前在考勤、门禁、电视、安防等广泛的领域已有一定的行业及个人消费市场应用。
应用之三: 自动驾驶
在自动驾驶领域,各大厂商普遍运用了机器学习的算法来使自动驾驶汽车更加智能化。 在2017 年的 CES 展会上, FCA 的纯电动自动驾驶概念车 Chrysler Portal、本田的 NeuV、福特的第二代 Fusion 混动自动驾驶试车、现代的 Ioniq、法拉第未来的首款量产电动车等几乎都采用了机器学习特别是深度学习的技术。
运用了机器学习算法的自动驾驶汽车会根据用户的打分回馈去不断修正自己的行为模式,从而逐渐满足客户的要求。例如,当特斯拉自动驾驶汽车用户行驶在右车道,靠近高速公路出口坡道时,车子会倾向于直接开往出口, 因此用户必须快速将主控权拉回来(修正路径),直到车子离开出口坡道。但随着经验的累计,车子也慢慢降低了每当车子靠近出口坡道时,直接开往出口的倾向,直至无需手动修复。这表现出了机器学习的高度可塑造性。
应用之四: 医疗诊断
基于机器学习的大数据分析能力,机器学习可以应用于医疗健康领域。 机器学习系统可以根据病人的症状和一个匿名的病人资料数据库,预测该病人可能患了什么病。这样的决策模型,可以程序为专业医疗人士提供支持。 IBM 在 2016 年开始致力于将其认知计算机器人与健康医疗相结合。 2016 年 8 月 12 日, Watson Health 正式进入中国市场开始其“认知医疗”系统的推行。此外, 东京大学医学研究院利用 Watson 在 10 分钟内判断出一位女性患有罕见的白血病。 这些进展预示着机器学习在健康医疗领域有着广阔的前景。
End.
转载请注明来自36大数据(36dsj.com): 36大数据 » 从AlphaGo 围棋大战到AI 德扑大战的机器学习技术解析