源码资本张宏江:中国AI创业的泡沫和机遇
“全世界在经历第三波 人工智能 浪潮,这波AI新浪潮跟互联网浪潮有很大不同。互联网的重点在于商业模式的驱动,而AI则是由技术驱动的。”
在2017年新商业峰会上,源码资本投资合伙人张宏江博士分享了这一波人工智能热浪的实质以及会给我们带来哪些挑战与机会。
张宏江博士认为,人工智能技术的核心 机器学习 已经从传统的数学建模向依赖 大数据 学习转移了。这波人工智能浪潮会带来更多的可能,有赖于行业的大数据和AI的人才储备,中国有望在技术上引领世界,这对于中国的 创业 公司来说是一个机会。
在AI如何影响人类的生活上,张宏江博士认为,我们应该做好准备,未来人工智能不光能够辅助人,而且能够代替人或者超越人,因为新的AI算法已经具备了“上帝的视角”。而目前,凡是跟感知相关的语音识别、图像识别,AI已经超过了人类。凡是跟理解认知相关的,AI还是有很长的路要走。
张宏江博士还在现场提醒创业者和投资人,目前,任何一家公司都敢说自己是AI公司,所以泡沫非常严重。如果说这个公司只有算法,只有几个牛人,没有数据或很难拿到数据、没有应用场景,这样的公司做不大。
以下是张宏江博士演讲实录整理内容:
冯总、各位嘉宾,各位早上好。非常高兴今天参加36氪组织的这个论坛。我想今天花点时间跟大家聊一聊这一波人工智能热浪的实质以及会给我们带来哪些挑战与机会。
数据成为新的宗教
这一波人工智能的浪潮跟以前的有什么区别?我认为中国这波人工智能的热浪比世界上任何地方都猛。原因也许是AlphaGo第一次在围棋上战胜了人类,使得我们对人工智能刮目相看。
但我们从人工智能过去60年来的发展来看,我们今天谈的人工智能的核心是人工智能的一个分支——机器学习,更具体地说是机器学习中用神经网络进行机器学习的技术,即深度学习的技术。
80年代中期到90年代初是AI的第二波浪潮,很迅速地就消失了,以至于我们很长一段时间都不好意思说自己是学人工智能的,很重要的原因是当时神经网络非常非常热,但很快就冷下去了。原因有两个:一是那个时候的神经网络没有大数据的支持;二是没有巨大的计算资源支持。
今天,我们不光有深度学习非常新的算法,更重要我们有了高质量的已标注的大数据,有了非常强的计算资源,从技术上来看,今天的深度学习跟以前的人工智能的方法,尤其是与专家系统的方法有根本的区别。
我们今天的算法实际上是基于数据驱动的,而不是仅仅依赖于经验规则。
我们来看看这波AI浪潮的两大驱动:第一,计算资源在过去30年突飞猛进,在过去的几十年发展中,我们看到人类的超级计算机的性能的指数增长和单位价格的指数下降;第二,AI的另一重要支撑数据开始大爆发。
根据IDC的调查,整个人类所创造的数据在2013年至2020年间会有十倍的增长,相当于每年增长率在40%左右。我们每天所产生的数据已经超过了10的19次方Byte。
今天大量的数据是由互联网产生,这些数据不光是数据量大,而且是被标记过的,比如你的手机会记录下你所拍的照片的时间、地点等等信息。正是因为这些数据的爆炸,使得我们能够为人工智能提供更多更好的训练数据。
讲一个我自己的经历,今天的智能手机都能拍照片和识别人脸,不只是给人脸做一些美化,还能告诉你这张照片都有多少人,什么人。这是我20年前的梦想,有一个移动设备能够告诉你拍摄的照片里面都有什么人。
经过了20年的发展,在手机上这件事情可以做成了。为什么今天能够做成,主要是因为刚刚提到的两点:计算资源和大数据,加上最新的学习算法。在我们90年代开始做这个题目的时候,整个数据库只有几百张照片,100多个人。
5年前当谷歌、Facebook、微软,这些工业的巨头开始利用上百万张、上亿张照片开始训练深层的神经网络时,用深度学习的方法来进行识别时,我们才真正把识别率提高了,在上亿张照片里准确识别出人。所以我想强调的是,当你的训练数据规模开始呈现增长的时候,你的学习精度也开始有非常大的成长。训练所用的资源和数据越大,训练的精度也同样得到线性提高。
今天这些AI公司所做的产品,背后所用的训练数据已经不再是几千万,而是几亿,覆盖面非常广,包括不同的场景、不同的环境、不同的侧面。这也是今天为什么旷视科技这样的公司,不只是中国人脸识别技术的巨头,也是世界人脸识别的领先者。
所以我想在这儿总结一下,这次的人工智能技术的核心在于机器学习,而机器学习已经从经典的理论建模往大数据驱动转移了。
在人类的科技发展史里总是有一些先知者,今天我想跟大家介绍原来微软研究院的一个杰出的学者Jim Gray,他十年前提出一个概念“人类科学研究的四个范式”:从一开始纯粹的观察,到牛顿的数学理论方式描述整个世界,到五六十年前开始用计算方法模拟世界,到今天第四范式用数据来驱动整体的研究。
正是因为这些技术的发展、大数据的普及,使得我们今天看到在全球各地的公司里面,已经有很大一部分公司,开始把他们的业务建在大数据的基础上,包括,IT公司、传统制造业公司。
数据成为了我们一个新的宗教,这也是为什么像英特尔这样做芯片的公司,在过去大手笔并购做人工智能的公司,因为数据是一个新的燃料。
“上帝的视角”
刚刚谈到了AI这波的发展背后的两大驱动力,计算和数据, 下面跟大家分享一下AI的未来对于我们产业、对于我们生活到底有什么影响。
第一个角度是说AI能够做的人能够做的事情,但是会以最快的速度、更大的规模,人类能不能像AlphaGo一样下一百万盘棋,这是不可能的。
第二人类是否能像特斯拉那样,每天从路上跑的几十万辆车里学习它们的数据。再一个就是人类能否瞬间比较出所有摄像头拍出的人脸的数据,显然我们也不如机器。所以无论从速度上,从群体学习的能力上,还是从规模上,我们都比不上制造出来的机器。
人工智能的机器在未来不光是能够辅助人,而且能够代替人或者超越人,我们对这点不应该怀疑。
我们原来说机器在有逻辑的、有数学表达的应用上可能会很快超过人、代替人。是不是在人类能够做、但是不能够用数学公式描述出来,比如说怎么开车、怎么骑自行车、怎么画画,今天我们从AlphaGo的表现已经很清楚地看到,正是在这些无法用数学明确的描述的场景下,机器也开始超过人了。
那么机器其实无论是在自动驾驶这块还是在画画这块,都已经表现出非常出色的能力,而且柯洁在和AlphaGo下棋之后说了一句话,“人类围棋几千年的发展我们只看到了冰山一角,而AlphaGo则有了上帝的视角。”AlphaGo经过了这么几年的训练,它爬的山比我们高得多,所以它看到整个的布局比我们广泛得多,而我们人类只看到了中间很小一部分,相当于它具备了“上帝的视角”。
这时候我们想想AlphaGo所代表的未来,也就是说智能系统、智能机器,未来会超过人、替代人。其实在人类发展的历史上,或者在整个地球发展的历史上,我们可以看到有很多生物,当人类从一开始的猿人变成智人的时候我们的能力远远超过了它们,所以图灵在很多年前就说过,说当上帝创造了人类之后,很多动物已经觉得自己的命运很悲哀了。
今天当我们看到人工智能超越人类的时候,也许我们应该想一下,当初上帝创造了人之后,这些高级动物的感觉。今天其实我们已经到了这种转折点。
显然,未来有很多行业会被AI所取代,翻译、新闻记者的写作、投行的分析师,今天美国政府已经在组织一个团队来应对未来十年中,自动驾驶取代了卡车司机后对美国就业率的冲击。美国有800多万人的工作与卡车相关,而整个美国的就业人口是1.2亿。可见这个影响之大。
未来我们希望是从人工智能变成智能辅助,但这是我们人类的一厢情愿,我们希望造出一个机器能辅助我们,而不是代替我们。实际上,我们看到的是未来AI在很多很多场景下会取代我们。
如果大家看过《人类简史》这本书,大家喜欢这个作者的话,不妨看一下他另外一本书叫《未来简史》,他提出了一个观点,说未来AI的发展可能让世界上产生两种人,一种叫神人,一种叫闲人。
可怕的是神人可能只有1%,99%的人是闲人。当这个世界上90%的工作被计算机所取代的时候,这时候才会带来一系列的社会问题。
也有人说有三种人可以替代AI的冲击,一个是资本家,在座的做投资、做VC的,显然大家不用担心,你只要能够融到钱,投准项目就没错。还有明星和手艺人。但这三种人都不会超过人口总数的1%。所以技术进步的加速给我们带来的不光是对工作的影响,更深层次的是对文化、价值、伦理的影响,其实今天很难预测。
深度学习还有另外一个问题,就是说当它的性能不断地提高的时候,尤其被大数据驱动的时候,我们可能不得不接受一个现实,很多情况下深度学习所做出的决定,它是不能够自我解释的。
我们还是应该清醒地认识到我们今天谈的是智能的机器,而不是机器的智能,或者说机器的智能跟人的智能还是有很大的距离。今天我们看到中国市场上对于AI充满幻想,投资方面有很多的泡沫。根本的一点就是人们没有认清楚,到底AI今天很强的地方在哪儿,做不到的地方在哪儿。
不过,我想告诉大家,凡是跟感知相关的语音识别、图像识别,今天的AI算法许多情况下已经超过了人类。但凡是跟理解认知相关的,AI还是有很长的路要走。所以有任何人跟你说,他做出一个能够模拟人类思维的AI体系,基本上就可以打一个非常大的折扣了。
泡沫和机遇
既然这波AI浪潮跟以前不一样,那么作为从业人员和投资人员,我们应该怎么来判断AI这个机会,判断投资机会呢?
互联网女王Mary的报告有一点总结得非常好,就是说在18世纪之前农耕社会的时候人们是靠种植收割来生存的,靠手工做的,到19世纪、20世纪工业革命的时候人们靠机器、靠工业,21世纪的话人们靠的是计算机的能力和人的能力的结合。
我们投资的时候一定要想的是,AI哪些方面能够让人的潜力得到更高的发挥。过去这几波科技浪潮,每波科技浪潮总会出现平台的公司。
我们要看到哪些应用规模特别大,而它又能够产生大量的数据,当你有数据、规模又大的时候,自然人工智能就能够被引进来,改善整体效率,从而使得生产率有进一步的提高,创造出新的应用,从而能够产生一些有规模的企业。
我们在判断AI投资的时候有一点要想清楚:AI这波新的浪潮,跟上一波互联网的浪潮有很大的不一样。互联网重点在于商业模式的驱动,而AI是技术驱动的。AI是从颠覆现有的行业开始,不是会把这个行业消失,而是让这个行业变得非常有效,所以说和垂直的应用要结合得非常紧密。
大家做投资应该很清楚,现在任何一家公司都说自己是AI公司,所以泡沫非常非常严重。这块我们有几点要把握住:如果说这个公司只有算法,只有几个牛人,没有数据、没有应用场景,或者说他未来依然很难拿到数据的话,这样的公司做不大,很难持久。
在你看这些AI企业的时候,要想清楚这家公司今天有没有数据,能不能够持续地生产、获取、控制数据,能不能实现对数据的占有程度比别人高,这些都是最根本的。只有当技术和获取数据的能力结合的时候,它才有一个非常强的护城河。
我这儿举个例子,大家知道今日头条过去五年迅速成长,背后的原因在哪儿?其实背后的原因就是解决了人们非常根本的需求,把人和信息连在一块。我们几千年前就以在绳子上打结的方式记录一些事件。活字印刷、造纸术出现以后,信息的传递就变得更加方便。到了PC互联网时代,我们知道互联网实际上是把所有的信息连接在一起,用互联网的方式呈现出来。
到了智能手机和移动时代,我们知道这时候你的信息终端永远在你手上。人们获取信息就比以前方便多了,同时也产生了信息爆炸。信息产生的速度比你看的速度快得多,这时候PC互联网时代的搜索已经变得不能够满足人们的需求了,你不能够再让人去找信息了,而是你知道这个人需要信息的时候把信息推给他。这恰恰是今日头条的核心商业模式,其核心是技术。今日头条通过对人工智能的算法,通过大数据的算法,通过你手机上所产生的数据,对你需要什么样的信息,何时需要信息了如指掌。
今日头条大数据的能力也非常可怕,月活跃超过两亿,日活跃超过1亿,每个人使用时长超过76分钟。今日头条通过技术,通过数据,建立起了一个天然的屏障。在世界上所有的移动互联网应用中,只有一个应用时长超过了它,那就是微信,90分钟。
当我们意识到这波AI的潜力时,当我们知道这波AI所能带来的价值时,我们创业的时候要记住三点,第一点是人工智能是我们未来的一个核心的竞争力,这点是毫无疑问的;第二点是,AI的产业现在有三种模式,一个是自主开发,一个是卖技术,一个是人工智能即服务。
目前大多数的公司属于第二类,基本上就是有技术,有几个人,这些人很强,但是没有数据,然后应用场景也不属于它,所以基本是做咨询服务,这不可能做到非常大的规模。
最后一点,AI是中国创业公司的一个机会,是中国引领世界潮流的机会。在移动互联网时代,中国的微信、今日头条,已经在引领世界的潮流,在AI场景里,两个竞争门槛——数据和人才,中国都是不缺的。在世界上所有的学术刊物里,中国的机器学习,尤其是深度学习,神经网络的论文作者在2014年就超过了美国。此外,在中国的已经标注的数据量是世界上最大的,基数大,而且数据量大。谢谢大家。