人机大战:百度大脑要参加《最强大脑》和人类正面对决
文/ 王飞
继今年 DeepMind AlphaGo 战胜顶级围棋选手李世石之后, 百度 AI 百度大脑也要挑战人类,这次的比拼则通过一场科技类的电视节目——《最强大脑》。
12 月 16 日在《最强大脑》第四季新闻发布后还没结束的时候,百度大脑微信公众号已经率先推送了关于百度大脑将要参与到《最强大脑》栏目组比拼的消息内容,百度董事长兼 CEO 李彦宏表示——这次参与到《最强大脑》比拼的“小度机器人”将代表“百度大脑”和当今中国人工智能的最高水平,与《最强大脑》名人堂的选手们约战三场,争夺进入最终世界脑王争霸赛的资格。
根据 PingWest 品玩在现场了解到的信息,这次录制将通过三场比赛三局两胜制的方式比拼,约战领域将是图像、语音识别以及综合识别三方面。在会后的沟通环节,百度深度学习实验室主任林元庆提到了其中一期比赛可能是“看大人的面孔找到童年的照片,或是从童年的照片找到大人之类的比拼。”
李彦宏也提到——“百度大脑”拥有万亿级的参数、千亿级别的样本以及上亿级别的特征训练,它的工作机制和人脑有类似之处。不过人脑和机器的智能适用于不同领域,北京大学心理学系教授、博士生导师,也是这次活动的嘉宾魏坤琳提到,“人脑所擅长的,都是后天学的,但是人脑不擅长搞记忆。其实像围棋那样非常复杂的任务,不是我们人类非常擅长的,将来机器可能更容易超越,我们恰恰擅长的是感知和运动, 这一次挑战是拿了人类比较擅长的东西和机器打。”
复旦大学国际关系与公共事务学院博士、副教授,同为这次活动的主持人蒋昌建则认为——每个项目当中,其实不单单是一个比如说人脸的辨识,也涉及到数据储存的问题,比如对初步的数据进行辨识以后储存,也是一个记忆的问题,机器明显的要在这个方面强过人类。
人类在调动这些短期内记忆的这些东西的时候,可能就比机器弱,但是人类在最后挑战的时候最后所做的判断是建立在储存的信息的基础上进行人类比较擅长的分析,因此它的优势和它的弱势之间形成一个平衡,也不是说人类完全占优。
要参与到这么一场营销和炫技兼得的大型电视真人秀节目中来也不是件容易的事情。百度和《最强大脑》节目组两方表示——这次节目组也找到了国内几家顶级的技术互联网公司进行 PK 筛选,最后的结果是节目组更看中百度在方面的技术实力,所以才找到百度大脑作为这次人机大战的 PK 对象。
下面是会后林元庆、魏坤琳在采访环节的内容精选。
林元庆在 IROS 2016,图片来自 leiphone
记者:我对百度无人驾驶、深度学习都有一些了解。我想问一下小度机器人加入最强大脑战队的出发点是什么?是做深度学习测试,还是真正为了夺得某个奖项?因为有一个背景是三月份 AlphaGo 和李世石那个对弈非常精彩,是不是会跟 AlphaGo 做一个对标呢?
林元庆: 百度在人工智能这个领域确实投入非常大,特别是在公司内部。非常棒的是最强大脑节目找到我们,看看我们能不能做这么一档节目,我们觉得是非常好的机会,来看一看百度过去几年研发的一些人工智能技术已经到什么样的水平上。其实我们的目的不是说来打败人类的,更重要的还是检验我们自己——我们如果赢了,我们还是得继续再研发,把技术运用到实际产品上。输了的话,还是回去做研发,希望研发出更好的技术。
记者:主要是从哪些方面跟人类去做一些对战?
林元庆: 比拼的方向主要是图像识别和声音识别。这两个方向是人类比较擅长的,因为人类是与生俱有的能力,图像识别就是看的能力,声音识别就是听的能力,听和看是人类非常擅长的。整个人类的视听系统应该说是非常好的。
魏坤琳: 不过人脑所擅长的,也都是后天学的,但是人脑不擅长搞记忆。其实像围棋那样非常复杂的任务,不是我们人类非常擅长的,将来机器可能更容易超越。我们恰恰擅长的是感知和运动,很多老百姓不知道这一点:人类文明社会是一万年前,一万年前农耕社会才发明了文字,后面才有人引以为傲的(各种发明的)东西,前面几百万年我们干的事情就是在狩猎和采集,如果(真的一直)在东非草原边缘上干了几百万年的话,唯一最擅长做的事情,就是运动和感知觉。这一次挑战是拿了人类比较擅长的东西和机器打。
蒋昌建: 这里面还有几层意思。每个项目当中,其实不单单是一个比如说人脸的辨识,也涉及到数据储存的问题,比如对初步的数据进行辨识以后储存,也是一个记忆的问题。机器明显的要在这个方面强过人类,人类在调动这些短期内记忆的这些东西的时候,可能就比机器弱,但是人类在最后挑战的时候,特别是我们的项目当中,最后所做的判断是建立在储存的信息的基础上(进行人类比较擅长的分析),因此它的优势和它的弱势之间形成一个平衡,也不是说人类完全占优。
记者:问蒋老师一个问题,刚才您说这档节目的初衷并不是想要着重在于人脑和跟电脑的对抗,人机大战并不在于两者之间的对抗…(那是在于什么?)
蒋昌建: 不关注谁输谁赢,对节目组来讲这不是我们最大的压力,我们最大的压力像刚才魏坤琳讲的,一个是怎么建立一个公平的规则,能够把人工智能的机器人,它研究到目前最好的潜力给表现出来。 比如说机器人明明计算强过人类,比如说人在某些领域当中的挑战远远超过人工智能现在的水平,基于一种目的的比拼都是不公平的。在项目的规则的设计当中就要考虑这种平衡,把双方的潜力都能够发挥出来,这是我们最关心的第一个问题。
第二个问题,在 PK 的过程当中,当然一定会有输赢,因为要完成一个任务,但是输赢的背后看两件事情。第一个有没有给人工智能提出新课题,还有是有没有给像王昱珩、王峰这样顶尖的(最强大脑)选手提出新的挑战。
第三个问题,我是一个有感情的人,你肯定问我作为主持人来讲,跟节目有没有关系,如果人胜的话你的感情是什么?如果机器胜的话呢?我非常矛盾,说老实话我是希望人能够胜利,但是当看到机器人在有一些局面是胜的时候,我的感情非常纠结。
我给你一个场面好了:当机器人在某些局胜的时候,机器人是不懂得高兴的——他在场上,但场下整个的研发机器人的团队抱头痛哭;当我看到人战胜机器人的时候——我哭了是人在哭。当我看到机器人战胜人的时候,工程师团队抱头痛哭的时候也是人在哭,所以你问我的心情,我可以这样回答你,我在意什么?其实我在意这些东西,我不是特别在意输赢。
记者:之前最强大脑节目组找过国内很多顶尖的互联网公司和最强大脑进行一些合作,今年 3 月份的时候搜狗这些王小川也参加过类似的节目,各个不同的互联网公司对人工智能方面的研究有什么样的区别,百度的话可能就是说已经有一个小度(百度大脑)出来了,比如阿里或者搜狗这种,可能更多人工智能还没有一个形象化的东西出现,实际上他们开发的方向可能有一些区别,在你看来的话国内现在的互联网公司间,他们的区别在哪里,排名一二三的。
魏坤琳: 首先大的互联网公司布局都特别大,过去一年之内发表的有关人工智能的研究中国人占了 1/4,其他的主要都是美国人,美国人中间有 80% 的研究是跟中国的合作。你看知识的迁移,的确各大 IT 公司在后面的投入是非常大的,百度更加是恨不得把自己的身家全都压上去。其他公司可能还有很多重头,而对于百度来说这个投入是非常大的。
像搜狗、阿里都有类似,但是他们做的可能比较有一些特定的领域,百度可能比较广一些。另一个百度的优势——我不知道栏目组为什么最终跟他们合作——我觉得有一个优势是在这几个领域上面,语音识别、声音识别和图像识别上,(百度)的确是目前国内做的最好。别的公司可以喷我,但我看到了数据——百度参加其他的大赛,参加国际上的大赛从来都是拿第一的,国内公司就是第一。去年 MIT 有个权威的十大科技突破,我看那个新闻稍微惊讶一点,因为是整个科技领域在全球范围内的突破其中有一项是百度的语音识别。
人工智能到底离我们生活有多远,比如自动驾驶离的比较远。但是自动驾驶到现实生活中可能它不是一个线性的发展,不是大概看的趋势十年以后再看。科学发展不是这样,可能就是突然一个技术突然出现,突然一下有一个非线性的发展,第二天自动驾驶车就出来了。所以不要用线性的思维预测离我们很远。
我特别感到高兴的一点,就是这次最强大脑能够和他们强强联手以后,过去我们老百姓不明白科技界发展什么事情,普罗大众不太明白,我们做研究也不太明白人工智能发展是一个什么趋势,但是我们是不是通过这个形式在思想上早早给老百姓做一些铺垫、准备——这个东西到底强到什么程度了。所以我们把人擅长的和机器做对比,我们看一看这个东西的结果是怎样,也是对老百姓非常好的科普。
第二点,刚才蒋老师讲个人情感问题,这个问题提前给大家看更好,我们会跟人工智能之间产生情感的纠葛,这是迟早的事情,提前拿出来讨论也很好。
记者:今天拿出来两个人们比较喜闻乐见的项目语音识别和图像识别。百度在这两个项目,技术上面有没有推出来的应用,就是已经有一个产品。
林元庆: 人脸识别的话,刚才提到 2016 年之前做了互联网图片人脸的索引和搜索,你搜魏坤琳会出来一串的魏坤琳的照片,那是因为我们对整个互联网上面的照片都做了人脸识别。大家可能平常会觉得——我搜魏坤琳应该就出魏坤琳,是因为很多的话全网的照片都做了人脸识别。
记者:什么时候开始的?
林元庆 :过去这几年一直都在做,开始的话应该在 2013 年左右。人脸识别在百度内部已经用到百度的一个部门,互联网金融很重要的就要能够识别电脑前面或者手机前面这个人是谁,就是身份认证。现在百度人脸识别已经用到了。
刚才我也提到下一步包括在外部的落地,就是 11 月初在乌镇进驻景区刷脸就行了。我们那个技术和大家市面上看到的人脸识别技术还不太一样,人脸识别技术有两种:一种是一比一的比对,像银行身份认证一般提交一个身份证,然后提交一张照片,系统会拿身份证去公安的系统里面取一张你的身份证的照片回来,现在的照片和身份证的照片进行比对,看这是不是同一个人,这是一比一的比对。
我们乌镇景区其实是更难的系统,是一比 N 的比对,只要你登记完之后,你的照片已经在数据库里了,过这个闸机的时候不要再拿身份证,过的时候就得到你的人脸照片,跟数据库几千人或者几万人去比较,甚至几十万人。原来是一张比一张,这个的话是一张比几千张或者几万张,我们叫一比 N 的比对,这个要做到非常高的精度还是非常难的。
记者:除了行业内的工作人员,其他的朋友会问这个真的能识别吗?节目是不是也是提前录制好的?
林元庆: 我们跟这个节目合作之后,就像今天做的这个比赛项目(识别童年照),我们会把这项技术开放出来,这个会让大家体验。
这个节目从头到尾都是一遍录完,我们来之前只知道要挑战什么样的内容(方向)——有的是拿小孩的照片去找大人,还是拿大人的照片找小孩,我们只知道这些。所有其他具体比赛项目都非常保密,我们其实事先根本不知道。
记者:现在 AI 概念非常火。我很好奇的是前几年 O2O 的概念也非常火,今年 AR、VR 也非常火,现在已经证实了当年 O2O 有很多泡沫,很多公司已经死掉了。我想问的就是,我之前去参加了很多 AI 和某些项目应用结合的发布会,因为现在 AI 时代刚刚起步,像百度这种顶级的技术互联网公司也算是刚刚开始,如果说 AI 未来可能也是泡沫的话,能不能说一下什么样的公司才是真正的 AI 公司,什么公司实际就是假的,是泡沫?
林元庆: 这个行业里面,有一些泡沫,但 AI 确实是一下子能解决很多人解决不了的问题。很多初创公司成立,同时有很多 Google、Facebook 这种重量级的公司也投入非常大的力量做 AI,Google 也说他们是人工智能公司了,不是搜索的公司,像百度也会觉得人工智能是我们的下一步。这里面都有非常大的投入,但是非常重要的在于,是不是扎实做事,这个是最重要的。比如技术方面,是不是研发了非常强的技术,技术是不是落地了,你刚才说怎么看哪一个公司不是真正的 AI 的公司,就要看这两个方面,不要看融了多少钱,现在融钱是容易的,更重要的是什么场景,这个 AI 对它的推进到底有多大的帮助。
记者:我听到的是这个行业有做算法的、做模型的,这种可能是真正在做技术提升自己的实力,应用这方面更像是在套用一个成熟的模型,然后做 app 落地这种事情。现在在做 AI 的初创公司,您能不能给我们做一个分类?
林元庆: 还是不要给别人贴标签,不太好。
记者:也不是具体提哪些公司,是不是有这种现象?
林元庆: 是有的,有的公司做应用,有的公司做技术,可能把很多时间花在算法上,但是其实像人工智能如果只做其中的一块问题不大。人工智能整个的研发体系,我说做人工智能很重要的一点是要有大应用,经常看到一些发布会 PPT 上说人工智能最近这几年比较这么快,是因为深度学习、大数据、大计算,这三个肯定是很重要的——这三个能够搭建,能够研发一些技术,直接用到某些产品。但是要把这些技术做到极致,接近百分之百解决实际问题,一定要有技术研发出来,一定需要在市场迭代。为什么迭代很重要,不单单在于算法的迭代,而在于数据。
有算法有数据就会研发技术,技术变成产品,产品走到市场,用户再用你的产品提供无限数据,有更多的数据就能够研发出越好的技术,就有越好的产品,就有越多的人来用,这才是一个正循环,这个也非常重要。比如我只做算法,前面后面不用,整个这个技术就很难有非常大的发展。但是只做应用,没有很好的技术驱动的话,手里拿个数据,可能数据也会比较慢,最重要的是把这个闭环用起来,这是我们在百度非常追求的事。
内容来源:PingWest 品玩