电子游戏背后,那些鲜为人知的科技创新
来源:刺猬公社(ID:ciweigongshe) 作者:柳南 编辑:园长
游戏AI从围棋盘走向工业尝试。
2016年春,韩国首尔四季酒店大厅内。
世界第一围棋棋手李世石愁眉苦脸地走向布置好的主席台,坐在一张椅子上,放眼望去,台下满是媒体记者长枪大炮般的摄影机,灯光闪烁。
左一为李世石,他旁边的是AlphaGozhiu之父戴密斯·哈萨比斯
01 一次举世瞩目的交战
李世石刚刚与AlphaGo系统进行完第一场比赛,落败。赛前,他信心满满地说:“我相信人类的直觉还是遥遥领先于机器的,人工智能难以望其项背,我将竭尽所能捍卫人类的智慧。”李世石希望以4:1或5:0战胜AlphaGo。
AlphaGo系统由英国计算机公司DeepMind(DP)研发,2014年DP被谷歌收购。DP把AlphaGo在围棋的对抗视为“人工智能领域的阿波罗计划”,DP的任务是从根本上理解智能,然后人为塑造智能。
第二局开始,全世界有八千多万人在看比赛,六千多万在中国。AlphaGo在此局中第37手下了一个人类只有万分之一概率会选择的“败子”,全世界的人都疑惑为什么会如此选择时,棋局进入临界点,李世石再次输了,“败子”把整个棋局盘活了。
每局比赛结束,李世石都要面对媒体。在聚光灯下,李世石和人类一同进入焦虑时刻,他说,自己一开始就丧失了主导权。全世界的媒体也从一开始讨论AlphaGo如何厉害,变成恐惧和伤感。
第三局没多久,李世石落败,媒体上铺天盖地出现了关于他的质疑,他不再是代表人类对抗人工智能的英雄,反而成了一个落败者。李世石也在媒体面前道歉:“如果我的棋艺更高超,或智商更高超,结果可能截然不同,这一次我让很多人失望了。”
在输赢已定的情况下,李世石内心的重担反而放下了,第四局进行到1个小时14分时,李世石在第78步用挖,在对手相隔一路的棋子中间落一子。这招之后,AlphaGo预测的胜率开始大幅下降,直至脱轨,它更换评估方法和搜索路径,所有人都不知道它在做什么,大家都觉得它的行为表现很奇怪。
AI的核心算法是深度神经网络,也就是在电脑上模拟人类大脑的神经元网络,这种算法的美妙之处就在于程序能给自我学习,也就意味着它能做出超出程序设计师所知范围的事情。
忽然,电脑对弈屏幕上,出现一条弹窗:“the result ‘W+Resign’ was added to the game information”。
“the result ‘W+Resign’ was added to the game information”。
W代表获胜方,也就是李世石。阿尔法投降了。
在AlphaGo的预测中,李世石走第78步的概率只有0.007%。李世石也不知道自己为什么会走第78步,他说,那是他知觉中唯一能走的一步。
即便如此,李世石最终只拿到一个胜局,而他与AlphaGo一同完成了人工智能的有一个里程碑,上一枚里程碑建立在1997年,IBM的超级计算机DeepBlue(深蓝)击败了世界西洋棋棋王加里·卡斯帕罗夫(Garry Kasparov)。
简单来说,因为游戏很容易量化计分,我们很容易从中测量渐进式进步(incremental progress),DP想要AI取得突破,就绕不开围棋,因为围棋是人类有史以来发明过最复杂的游戏。
围棋起源于中国,拥有两千多年历史沉淀,只有一种棋子,也只有一种落子方式,双方各执黑白棋子,目标是把棋子连接起来,制造一个彼此相连的群体,把一个空地圈起来,被包围的棋子就会被清除出去,通过保卫领土的方式消灭对手,获得胜利。
表面看起来很简单,实际上很抽象,不是所有人都玩得转。DP研究人员计算过,围棋每一步大约有两百种选择路径,棋盘上出现的棋局数量,比宇宙中的原子数量还要多,围棋变幻的数目,即使运用全世界彼时的电脑算力运转,100万年也没法穷尽它可能变化的形式。
认知决策模型是人机对抗规程中的核心环节。AlphaGo由三个主要部分组成,首先是策略网络,DP用数以万计的高水平棋局训练它,并模仿那些厉害棋手的招式;第二部分是估值网络,第一个棋子落入棋盘,可以衡量棋局的形势,计算出各个位置的胜率,第三部分叫做树搜索,用来分析棋局各种可能变化的情形,并尝试推演棋局未来的演变。
“AlphaGo是要最大化自己的胜率,它不关心自己具体赢了多少子多少目。”赛前,DP团队成员期待,“如果能战胜人类,那就非同凡响了。”
02 在游戏中不断进化的AI
后来,人们复盘AlphaGo与李世石在第四场对战失败中寻找原因,发现第78手后连续出现错误,直指人工智能的鲁棒性。
可以简单把鲁棒性理解为稳定性,指一个计算机系统在执行项目过程中处理数据时维持正常运作的能力,如果稳定性差,能力也就差。
DP想要解决AlphaGo的这个问题,关键是提高策略网络和估值网络的精度。他们很快做了调整,在之后与中国围棋职业九段棋手、世界围棋史上最年轻五冠王柯洁的比赛中“三连杀”,让柯洁经历至暗时刻,掩面而泣。
业界很快从本次世界顶级对抗赛中吸收经验,在之后的同类型比赛中,不论是棋牌游戏,还是策略游戏,研究团队把其视为珍贵的AI鲁棒性论证支撑材料。
DP团队后来推出另一个机器人取名AlphaZero,仅仅运行8个小时,便以100:0的战绩碾压掉AlphaGo(击败李世石的版本),它还在继续进化。就在2016年围棋界划时代的“人机大战”一年后,“机机大战”在日本顷刻上演。
2017年3月19日,第10届UEC杯计算机围棋大赛在东京落幕,30个AI软件参赛,来自腾讯AI Lab团队研发的围棋人工智能程序“绝艺”过关斩将,在总决赛击败对手日本选手DeepZenGo,最终11战全胜,摘得桂冠。
如果说游戏为AI的进化提供了完美的试验场地,那么人类的丰富经验则为AI不断进化提供了充分的养料。
基于策略型手游《王者荣耀》的王者绝悟AI,其侧重点是多智能体,面临更多更复杂的环境,每天深度模仿职业玩家战术方法,同时自我博弈。
王者绝悟AI与真人对抗过程
为了评估控制能力的鲁棒性,2019年8月1日起,人类玩家可以与AI英雄1V1挑战。统计结果显示,AI英雄在比赛中几乎无败绩。
AI Lab提供技术能力,王者荣耀团队解决人工智能研究三大课题里面的场景和数据难题。“两个团队共享核心代码、数据、能力结构,在这基础之上强化机器学习。”相关负责人告诉刺猬公社(ID:ciweigongshe)。
“众包式”的游戏科研方法
游戏的互动性优势适合人们学习和实操一些静态知识,科研人员与游戏从业者协作工作,把游戏与科研融合成了一个很早就被看中的方向。
此类实验有很多,比如广为人知的太空题材游戏《星战前夜》探索计划。这是一个融合项目,是冰岛游戏公司CCP在2016年发布的公益类共创内容,他们与日内瓦大学、瑞典皇家理工学院等科研机构合作,吸引非专业科研人员参与其中,帮助科学家操作一些相对简单重复的识别与分类工作,目前主要推进了“人类蛋白图谱”“地外行星”两个项目。
在“人类蛋白图谱”项目中,玩家要对1300万个人类细胞蛋白质染色体图进行分类,在互动性和使命感号召下,超过30万名玩家参与该项研究,总计完成3300万个图像分类,确实帮助科学家提升了研究效率。
在更早些时间,华盛顿大学科研人员开发过一款益智游戏《Foldit》,开发人员利用人类天生的三维图形匹配能力,允许普通玩家对氨基酸进行自由组装,最终组建一个蛋白完整结构。一个与艾滋病相关的蛋白结构曾困扰科学家15年之久,2011年,《Foldit》和玩家用10天时间,帮助科学家成功解读。
《Foldit》没有停止脚步,2020年2月,针对新冠疫情,研究人员推出新关卡“1805b:冠状病毒尖峰蛋白结合剂设计(Coronavirus Spike Protein Binder Design)”。简单来说,需要玩家针对既定蛋白中的链,重新设计出一种新的蛋白质结构,阻断新冠病毒与人体细胞结合,帮助研发人员发现抗病毒新药。
几年前,《美国国家科学院院刊》刊登过一篇3.7万人写的论文,但“作者”也是游戏玩家,他们在科学游戏《EteRNA》中设计核糖核酸(RNA)的分子创造蛋白质。这件事的思路与《Foldit》如出一辙,实质都是众筹科学实验,集体智慧的力量在某种程度上超越了超级计算机。
这种形式更像是“众包式”的游戏科研方法途径,科研机构把一个科学命题分发给全世界玩家,自由参与其中,而具体任务有个人承担。对《EteRNA》和《Foldit》进行过深入研究的美国信息传播学者凯西·奥唐纳说:“让游戏和玩家参与到科学,我们改变了科研的形式。”
03 游戏与工业“共生”
在工业制造领域,游戏还推动着数字孪生的发展。最早的数字孪生概念可追溯到2002年的美国。密歇根大学教授迈克尔·格里弗斯(Michael Grieves)在美国工业制造工程协会举办的一个论坛上,针对产品全生命周期管理提出“镜像空间模型”概念,构思工业工厂在虚拟空间模仿生产流程,并进行实验管理,提升效率。
对于传统工业而言,稳定性、安全性和低效能是他们一直追求的方向,行业先行者曾利用传感器等方式对现实世界进行扫描投射,但成本太高、操作程度太难,没能快速前进,直到虚拟引擎的出现与进步,让游戏成为他们实验的最佳场所。
数字孪生应用是数字工业领域目前最火热的方向和话题之一,包括沃尔沃汽车、京东、阿里巴巴在内的很多国际型大公司都在使用Unity支持下的数字孪生技术能力。
根据美国咨询公司Forrester在2020年的一份报告判断,数字孪生应用正处在大爆发前夜。55%的工业公司会在两年内使用数字孪生应用,94%的已使用者会在数字孪生应用方面加大投入,这将会颠覆现有的工作流和过程。
春江水暖鸭先知,早早与Unity合作的科技公司并非来自To C互联网,而是来自传统工业领域,其中包括沃尔沃汽车。
但是在实践过程中,并非一帆风顺,内部阻力不容小觑。主导这项技术合作的高级工程师张晓辰透露,现实操作中面临的第一个挑战是观念:Unity是一个游戏引擎平台,它能在工业领域做出成果吗?
张晓辰和团队比较年轻,当他们拿出成果给公司传统工程师看时,往往能直接改变他们的看法,甚至会启发新的思路。因为他们不是为了取代任何人,而是作为辅助工具,提升开发过程中的信息透明度和迭代效率,更快解决问题,降低成本。
除了刻板印象之外,还有工业流程方面的挑战,主要来自内容供给上。对于小型游戏开发公司而言,程序员、游戏策划师、UI美工、3D建模师都在一个团队里,一般的游戏逻辑都是为了一个游戏而打造。
而张晓辰在沃尔沃内部很难有这样的便利,他手头的3D车模和3D场景一个都没有,只能向拥有这些资源的人沟通,但并不是所有人都有义务支撑他们,因为这不是本职工作。他们一度当起中介,协调公司内部资源。
后来,他们从市场部同事那里拿到购买的3D模型,制作了一个安全测速模型——当车行进到学校等路段时,系统自动限速。两周内加班加点完成任务,这打响了他们的第一枪,逐步在公司内部迎难而上。
张晓辰后来总结,沃尔沃和Unity联手的过程相辅相成,Unity为沃尔沃提供技术和资源支持;沃尔沃为Unity提供汽车工业中的应用场景需求,并提供有效反馈。这条经验与腾讯AI Lab实验室、王者荣耀团队的总结基本一致,通过虚拟仿真,推动更多应用场景。
如今,随着包括Unreal、Unity等在内的一系列游戏引擎的发展,数字孪生体的主题角色不局限于车辆,还可以是人体、建筑物、医学细胞等。数字孪生以真实物体的替身出现在虚拟场景中,一切真实事物不方便测试的场合,都可以在通过数字孪生在虚拟空间中实现。
也正是通过游戏引擎技术能力的不断外溢,游戏与科技之间的关系正变得愈发紧密,在未来的科技创新与发展过程中,游戏承担的角色也将会越来越重要。