《浪潮之巅》作者吴军最新演讲:超级人工智能
10月22日,AMINO硅谷中国“新”大会在南京经济技术开发区举行。《浪潮之巅》作者、AMINO资本合伙人 吴军 发表了以《超级 人工智能 》为主题的演讲。
人工智能起源
我知道很多人都想听我讲人工智能是怎么回事儿?最近有两个最热的科技话题:一个是双子星,被人类监测到了。第二个是 Google 发表了一篇论文,其结果我们也看到了。如果有两个版本的Alpha Go下围棋就有趣了,原来打败李世石的是Alpha Go—1,为了区别。今天这个是Alpha Go — 0,其实打败科技的是Alpha Go — 0。这两者有什么区别?Alpha Go—1用的是人类的数据,而Alpha Go — 0没用人类的数据反而好了,这个很颠覆我们的认知。
说明一件什么事儿?为什么计算机打败人这么容易。以前,人工智能讲了很久都没有热起来,但到2016年就因为Alpha Go打败了李世石而变成热门。从这件事儿发生以后,阿里巴巴请一个有四年工作经验的博士生,开出的工资待遇是170万人民币。很多上市公司一年挣的也就是这么多。为什么这么热门?而在此之前,十年前你要是说搞人工智能的博士,像黄博士,你十年前说是搞人工智能的,找不到工作。你只能说你是干活的,就是这么大的差异。
为什么我们说泡沫?真的就是泡沫。几年前VR很重要,为什么VR很重要?就是因为Facebook收购VR公司。
那么人工智能到底有多特别?或者说我们为什么说人类的认知其实受到了历史的局限。我们再想想商业逻辑,为什么有些公司,比如说雅虎这家曾经很了不起的互联网公司很快走到了头,三大门户网站很快走到了头。你们想想其中本质的商业逻辑,还是说仅仅从人才上、战略上、经营管理上找原因?如果仅仅从这几个方面找原因,那思维永远在二流。如果你办一个公司是永远办不到一流的。
我们今天蚂蚁金融融资之后,估值已经很高了。另一方面,我们的国有银行的营业网点不断的在萎缩,这是什么原因?如果你认为是马云睡觉睡得很少,或者是智力比他高,错。背后的原因是在于人的思维和机器思维实际上就是人的思维和机器思维的一种对决。而Google这样的公司是机器的思维,雅虎这样的公司是人的思维。今天李世石被Alpha go打败了,同样的道理,国有银行被网银没有打败,生存空间被萎缩。雅虎被Google打失败了。以及今天很多人看新闻是通过今日头条,也就是说今日头条就打败了当年的三大门户网站,就是他们之间的一个对决。
介绍了起源之后,聚焦在人工智能上,到底什么是人工智能?
人工智能是什么?
有各种各样的判断的方法,比如说人脸识别, 语音识别 ,自动驾驶汽车,把人从一种语言翻译成另一种语言,这都是具体的案例。从本质上来讲,如果对计算机和人问同样的问题,如南京市的整个城市特点是什么?这是一个复杂的问题。但如果在座的各位分辨不出哪个答案是计算机出来的,哪个答案是人给出来的。这个时候就可以认为计算机和人有同等智能,这是一个完全客观的判断,不取决于主观。而且这是对结果的判断,不取决于方法,人有人的方法,机器有机器的方法。各有所长。
今天我们不一定说机器的方法就是最好的方法,但是生活在智能时代的人,必须理解机器的办法。
人工智能的历史很多,就不多讲了。但其中有一条,就是机器获得智能化的方式和人完全不一样,它是通过数据。最早发现这件事的人是康奈尔的一位大学教授,在1972年,那时候还你是人工智能,因为在六七十年代,很多人想搞人工智能,最后搞失败了。所以他们说要理解他的语言,做机器翻译等等,自然语言识别,语音识别,机器翻译等等这些事儿。人们传统地让计算机来模拟人的方法来做这个事,但只能识别不到100个英文单词,还错了一小半。
后来通信专家把这个问题想成是一个通信的问题,需要用大量的数据和数学模型,最后他在IBM把语音识别做出来了。从此,他和多位科学家和数学家仅花了几年时间就让计算机识别2000个英文单词,错误率不到10%,这是很了不起的成果。仅仅是这些专家走对了一条路,所以他就开创了通过数据驱动来解决人工智能的先河。
案例:飞机和汽车
实际上也很容易理解一件事儿,早期人类想飞行的时候都模拟鸟,胳膊上装上羽毛和翅膀,从树上跳下来,都是摔死的,无一例外。但是后来到了文艺复兴的后期,就通过物理学计算算出来这件事儿不可能。在文艺复兴的早期达芬奇做了模仿鸟的翅膀,到怀特兄弟发明了飞机,是因为人掌握了空气动力学的原理,才飞起来的。但这不是仿生。
今天也是一样,人工智能要做得好,要了解智能的本质, 机器人 和人工智能是完全不一样的道理。
汽车和马都可以跑,但是在福特发明汽车的时候,没有把汽车按上四条腿,而是四个轮子。所以也一样,当飞机飞上天和翅膀无关。今天很容易判定在人工智能领域谁是骗子,谁不是骗子,原因就在于他看有没有多深的了解。任何一个希望通过仿生的方式来实现人工智能的都是骗子,都是在给飞机装上振动翅膀以及给汽车装上四条腿。
案例:美图秀秀
今天的人工智能发展,其实每个人在用。一讲人工智能感觉好象非常高大上,其实美图秀秀就是一个典型的人工智能,我想大家都在用。美图秀秀不是通过一个简单的设置一些规则,把你的脸搞得好看一点。他通过学习每一个人脸,知道根据你的情况该怎么修。如果数据错了,结果就错了。这家公司在美国上市被人告了,为什么?因为很多人告他,在美国的美图秀秀,不管白人还是黑人,修出来都是黄人。因为他用的是黄种人的数据,就像Alpha go学下棋,如果用了人类不好的数据,结果就不好是一样的。
今天大部分人谈的人工智能,理解的跟人来得看病,开车等等都相关。还有人讨论超人,这其实某种程度上是杞人忧天,如果你了解到人和机器只是方式不一样的时候,就不会有这种担忧了。
思维方式要先进
对数据的认知局限性
在未来的时代,我们说把握技术的人,你能够做到二流就谢天谢地了,还要所有条件都具备了。真正要想做到一流,首先你的思维方式要很先进,先进之后做一个简单的判定就OK了。
之前美国很著名的物理学家的一本科普书里有一个很搞笑的故事。有两个原始部落的酋长,他们就想说我们怎么找到一个大的数字,每个人说一个数字,看谁说的大。一个酋长想了一会说了一个数字“3”,你觉得很搞笑对吗?他说的3。第二个酋长想了半天,就说你赢了。你说这是什么情况?你说4,说10,100都可以啊。问题是他生活的环境局限了他,在他的生活的环境下,就没什么东西。以至于3以上的数就数不清了,这叫许多。
今天我们觉得很好笑。Alpha go看我们一样好笑,你们人类给围棋发明了棋道,就是因为你们算不清,你们的脑子太笨,不就是个这么简单的道理吗?
围棋的复杂度,10的172次方,没有人可以想象出来有多大。一个1后面跟着172个0,我给你们换一种方式来解释,你就知道这个数有多大。如果我们把宇宙中的每一个电子,离子,质子,变成我们今天这么大的一个宇宙,把这么多宇宙中的每一个基本粒子再数一遍,那么这些基本粒子加起来的数量才是它的一亿分之一。所以这非大的数,对我们人类来讲绝对是无穷大。就跟我们看一万年前的酋长一样,数数才数到3。你说今天的人类不是这样了,今天人类知道 大数据 ,你说1亿我能说2亿,你说2亿我能说万亿,我们有这么大数据,不是的,今天人类依然只认知了很小的数据,我们依然生活在一个小世界里。
比如说去年年底还是今年初,中国王健林说了一个事儿,说是小一个亿的目标。小一个亿什么概念?小一个亿是1500万美元,美国98%的人一辈子都挣不到这么多钱,将近99%。也就是说你有一个亿人民币在中国、美国都财务自由了,在中国可能一两代人都财务自由了。对大多数中国人来讲,或者是对全世界的人来讲,一个亿和无穷大是没有差别的。所以他理解不了一个亿。但是王健林不一样,对王健林来讲,一个亿连一块地都不是。所以他行事的方法和我们不一样。
案例:鞋子的管理
我举个例子,我就问每个人有多少双鞋,马博士,你有多少双鞋?10双。有吗?那你怎么管理你的鞋?你不用管理,看看就好了,每天早上出门不要挑的。
这位美女,你有多少双鞋?100双?你怎么管理你的鞋?看一遍都来不及,每双鞋找一下20秒钟,半个小时看鞋,今天就已经迟到了。分类?当她有100双鞋的时候要分类。
如果是谁开淘宝店,有一万双,今天给他发货发了一双,光分类也不行,分了10类,每类还有1000双,一个鞋子一个小时才能挑出来,这个生意就不能做了。但是如果用索引,这双鞋在第几排货上的第几排,马上去了就拿。
不同数字的概念,你用的方法是不一样的。
非常遗憾的是人类是生活在3万、5万的数字下,我们用这样的落后的思维方式来解决今天所谓的大数据这个世界的问题,你是解决不好的。所以有些人在一开始就站在高处往下走,来解决就解决好了。
智能时代,这就是大数据时代和智能时代要有的思维方式。
案例:Google与雅虎
举一个商业的例子,刚起动互联网的时候,我是从雅虎开始用起的,因为早期的时候是什么东西都有的。你们最早用互联网的时候,去什么新浪、网易和搜狐的时候,我们都是从那里入手的。在当时互联网的背景非常好,就相当于差不多是吴婷的一百双鞋子,所以做一做分类就好了,所以就有了门户网站,通过几个分类就完了。这是那个时代的事儿。
等到Google进入互联网的时候,那就太厉害了,所以就需要做索引,而且要精准到一下子找到这个结果。Google是用一个非常大的视界来看待这个问题,所以今天做得很高。Google一家占了全世界互联网产值的三分之一。为什么占这么多?雅虎要贱卖,要死掉?原因是雅虎生活在一万双鞋的时代,他用一个简单的分类方法来处理这件事儿,跟不上。
案例:今日头条与三大门户网站
同样的道理,你今天已经不看新浪的新闻了,你们看今日头条。为什么?作为一个早期的媒体人,他今天能看到的世界发生的主要大事儿就这么几个方面,所以出来就是一张报纸,整个新浪的版面就是一张报纸,这是那个时代的思维带来的结果。今日头条今天一开始做这个事情就不是这个事儿了,铺天盖地的都是消息,所以他是怎么做?他唯一的办法就是用机器智能来做,没法用人工做。而且必须做成个性化的,因为他即使分完类,分成100类,你推一类,一类还有1千篇文章,根本不知道是哪篇文章。所以必须要换一个思维方式,给予个性化推送。不同的思维方式带来了不同的生意。
案例:支付宝与传统银行
马云的支付宝和银行有什么差异?银行是手工放贷,一个营业员一个星期最多可以放三五单贷款就完了。你要每笔贷款要了解一个企业信息,你了解得过来吗?马云面对的是什么问题,一大批的中小企业,一大堆的数据,根本没有人去做这个,做那个。所以他一开始面临的就是一个巨大的数据的市场,所以他用人工智能来做。
遗憾的是我们这个社会进步得很快,成长得很快。人的认知从3到1亿,经过了1万年,从原始社会到今天。计算机是什么样的增长速度?摩尔定律,18个月翻一番,意味着每十年涨一百倍。今天如果你还保留着十年前第一代的iphone今天装任何程序都用不了了,100分之一的速度怎么用?数据的增长量是多快?过去的三年,数据的增长超过了从三年前开始往前算有文字以来人类历史上的总和。
在这个时代,不是说人慢慢进化那么慢的增长,所以你要有一个计算机的思维。
这是我今天想讲的内容,具体的技术内容就跳过去,你们可以看我写的书,谢谢大家。
研究报告分享
10月12日,亿欧智库,联合阿里研究院、微链共同出品 《AI商业化“二次革命”的产业落地——2017中国AI投资市场研究报告》 。报告从三大产业链层次和18个重点行业,到投资机构市场布局和巨头企业投资战略,报告深入探索AI各投资领域的变化趋势,总结AI投资市场主要“玩家”投资规律。
阅读报告请点击: 《AI商业化“二次革命”的产业落地——2017中国AI投资市场研究报告》