前金山CEO张宏江:AI+大数据+云=企业服务的未来
在大数据方面,张宏江拿Alpha Go举例,它的训练数据远远超过人类大师一辈子的数据,再加上它900多个CPU,2800个GPU的计算能力,它的段位已经非常接近人类的大师了。“这是在比赛之前,没有考虑过其他的因素在里面,它的数据已经非常领先了。”而在围棋之外,全球数据以40%的增长速率增加,沃尔玛每4小时会产生2.5PB的数据量,推特每天有5亿条帖子更新。
关于AI是否会取代人类,张宏江博士也给出了跟李开复类似的观点,人工智能的应用是有局限的,必须具备大数据、边界清晰、外部反馈、顶尖数据科学家和计算资源五个条件。
张宏江认为AI 大数据的应用会成为企业的标配,“过去是分析、现在是预测、未来是认知。”而在AI和数据方面,都离不开云计算,它已经成为IT主流技术,云也成为了成长最快的2B产业。
在给出AI 大数据 云=企业服务的未来的结论后,创业公司该怎么做?张宏江博士也给出了建议:
- AI 大数据 云会跟所有新技术出现后,带来的商业机会稍纵即逝,创业者需要前瞻性眼光
- 需要很快的积累起我们的技术能力、工程能力,产生技术壁垒
- 需要有工匠精神,能够不断的改善我们的算法和分析能力,为企业提供更好的服务
以下为张宏江博士演讲实录:
我今天讲的题目企业服务的三个阶段是紧扣的,可以把它叫做3.0 或者是企业服务4.0。如果我们回忆一下2016年有什么样的主题始终贯穿着互联网、整个企业服务软件的市场、整个IT的市场,一定是三个主题:人工智能,大数据和云计算。
为什么这么说?
人工智能是我做过很多年的领域,那今天就从人工智能谈起,2016年的一件大事是在3月份AlphaGOvs李世石,很多人不知道AI这个词是什么,也不知道AI到底有多厉害,但AlphaGo赢了韩国的围棋大师,这具有里程碑的意义。
差不多在20年前,AI赢过俄罗斯的国际象棋大师,这20年间,人工智能走了非常长的路,在这个事情发生以后,很多人都认为人工智能将会统治世界。我不知道在座大家在这比赛前有没有人知道人工智能到底是怎么回事,有没有人跟你的同事下过赌,到底是机器赢还是人能赢,我下了赌,而且赢了钱。
这块有很重要的原因在里面,我为什么认为AlphaGo可以战胜人类的围棋大师,很重要的是背后的深层支撑,实际上今天终于有足够的计算能力,今天终于有足够多的数据,今天有人工智能算法(机器学习算法)。
我尤其要强调的是在数据和算法这块,人类大师一辈子能下好几千场真正的高质量的比赛,但是AlphaGo在它的有限的生命中间,和人类的6到9段的选手下过1.6万次,同时3000万次的机器对局,因为它本身没有所谓的感性的因素,所以自己可以跟自己下,所以这两个数据使得它的训练数据远远超过人类大师一辈子的数据。
再加上它的非常强的计算资源,900多个CPU,2800个GPU这样的资源,它的段位已经非常接近人类的大师了。这是在大师比赛之前,没有考虑过其他的因素,也就是说它的数据量比人类大师领先很多了。
所以真正的在AlphaGo背后隐藏的动力,其实是我们所说的大数据和强计算加上新的算法。这是今年发生的最热的一件事情背后真正的原因。
那么我们谈到大数据,在过去的几年中间谈得非常多,也有人发出大数据时代是不是已经过去的疑问,其实不是,而是刚刚开始,而且随着人工智能的发展,大数据的应用将会越来越广泛。
过去的几年间随着移动互联网的发展,人类的数据其实在爆炸性的增长,根据IDC的调查,整个人类所创造的数据大概是4.4Z,到了2020年这个数字会再增长10倍,如果你用一个标准的苹果的Ipad,里面有128G的内存,你把这44个Z存进去的话,可以从地球到月亮来回走9次。
比如说沃尔玛在2013年每4个小时产生的数据到了2.5PB,今天推特每天推的文字就5亿条,微信一天在朋友圈分享的照片就是10亿张,今天中国的存量照片是300亿张,但是企业界的数据增长的速度同样非常快。
我还是用移动互联网的例子,现在手机上非常普遍的应用就是照片,这种照片越来越多以后,你在手机上发现管理照片是个问题,所以两年前大部分的手机都开始出现叫做照片自动分类的云服务,包括根据人脸进行分类,当你看到这些照片的时候,你以前只能根据地点和时间进行分类,今天就可以知道根据人的面孔,把你的朋友、家人进行分类。假如我的手机上有雷军的照片,我就点一下他的照片,你发现所有他出现的照片全部都帮你找出来了,这背后用的技术是人工智能人脸识别的技术,这个技术今天在所有第一线的平台上都已经出现了。
这件事情在AI的历史上走了几十年,以我的专利为证,这是我1997年在惠普实验室申请的专利,这个专利基本的核心是:当照片进来以后我做一个人脸检测、人脸特征的提取,从而进行比对,而且我20年前就已经预测到这个体系很难在一个体系上实现,而需要一个分布的体系,所以它是一个分布式的数据库系统,今天看来这个东西就是手机。
这个专利是在2000年批准的。但是这件事儿至少在我看到走了20年,20年前这件事儿是非常难做的,除了算法没有今天这么先进之外,更重要的是我们的数据不够。所以以我来看过去20多年,计算机对人脸识别的发展就是一个数据库和计算能力的扩张。90年代初的时候你用的训练数据就是几百张、几十人,到了十年前,已经到了几万张或者是几十万张,我们能够用的人数也是到了几千个,真正到了过去的三五年,计算机或者是人工智能开始超过人的数量,一个典型的情况就是谷歌和Facebook在2015年年初的时候开始用大量的数据,包括着2亿张照片,800万人,因为有这么多数据所以能支撑起非常庞大的深度学习的网络,从而能够训练出识别准确率超过99.63%的算法和人脸识别系统。
当我们训练数据用了260万张的时候,识别率大概在76%,用了2.6万张的时候,识别率增长了10%,这是没有经过仔细的调优的情况下你可以看到数据对于识别精度的影响,同样当你用到算法的复杂度和计算能力之间也一样,只有当计算能力不断提高复杂度和精确度才能支撑起来。我的观点还是说数据和计算能力是AI背后的主要推动力。
在过去的两年中国企业在这方面异军突起,领先了国际市场,也领先了国际的学术的领域,这些从微软研究院衍生出来的这些公司,他们都做到了世界上最好的人脸识别系统,原因是他们都和微软研究院也许,更重要的是今天他们都有大量的数据,中国人口最多,中国的摄象头最多,摄象头密度最高。这一系列的数据使得我们能够做到最好的识别系统。
除了人脸之外,我们知道只要你做了坏事儿,只要在路上任何一个角落拍了你一张照以后,你基本上插翅难逃了,除了人脸识别以外,AI在什么领域会超过人类,这是我们今天讲的核心内容,AI已经在一系列的领域会替代人工,除了在人脸识别、下棋以外,在翻译、新闻记者的采编,尤其是财经记者的采编,在行政助理、警察、出租车、股票交易员、会计,包括保姆都会在今后的5到10年内很大的程度上被AI所取代。
为什么?你问自己几个问题,你可不可以像AlphaGo一样一天下几百万盘旗,人类能不能像特斯拉那样每天从路上超过20万辆跑的车上收取数据,能不能像所有遍布于各个机场、各个火车站的摄象头那样见到那么多人。正是因为这些无穷无尽的数据使得AI有越来越强的能力,从而他们不光是能够识别出人,而且比人类听懂更多的语言。
所以我们也同样相信这一切也会改变我们今后的企业服务的形态。你会问一个问题,是不是AI能取代所有的行业、所有的工种,所有的任务,很重要的一点,一定是在有大数据的情况下才能做到很好的AI系统,一定要有一拨很好的顶尖的科学家才能把这些数据形成很好的体系,从而有很好的算法,也需要有大量的计算机的资源。
其实在这里面我们也知道,无论是计算机资源,还是科学家这些你都能找打到,对于创业企业来说,但是大数据对创业企业是个挑战,你从哪能够获取这么多数据。
大家会问一个问题,到底多少数据足够多?在大数据的分析里面,我们从来说没有太多的数据,数据从来不够,因为很重要的。用传统AI的方式,性能也是随着数据的增加而不断的增加的,用最新的算法增加的数会更快,或者是饱和的速度会更慢。这是很重要的一点,当你没有数据的时候,用的最新的算法你的性能也只会在这儿,不会在这儿,尤其是我们今天碰到的越来越复杂的场景,你所需要的数据会越来越多。重要的是说当你的覆盖度、数据精度这两点达到一定程度以后,对于传统模型的依赖才会减少,缺少数据的时候才会做出一个模型来。
今天我们看大数据对于企业有什么影响,我想用美国一个调查的数据举例,大数据的应用已经非常广泛了,60%的IT公司里面,大数据已经成为日常中间开始使用,在商业和专业服务的公司里面也有将近一半的公司在用,金融47%的公司,最传统的制造业和零售业这个数字也在逐渐的上升,所以我们知道今天在我们的企业服务行业里面,数据已经变成下一个新的宗教。
过去传统对大数据的依赖使用它来做统计,我们知道过去发生了什么,我们很快用它来做分析,我们想知道这是为什么发生,今天更多大家在用到预测,未来会发生什么,未来我想我们会用到它,最大的会是认知,我们对于任何一个商业决策的反馈,从简单的知识到智能的演化过程,这个是今天大数据开始在企业服务里面发挥作用的一个核心原因。
当你有了大数据,有了先进的算法,像一开始演示的,在手机上做人脸识别,你可能认为手机本身有如此强大的功能,但是我想告诉你所有的计算都是在云端进行的,你的照片拍完以后是把它送到云端去,在云端进行了人脸的检测和识别,在云端搜索了联系人的数据库,从而返回到照片的人脸的信息,也就是说如果没有后端,没有云端的大规模的存储、大规模的计算、大规模的数据分析一系列的计算的功能,今天做不到我们说的智能。
云计算已经成为主流技术,今天已经不像三年前,你谈云计算别人会认为你谈在云里雾里是在忽悠,今天云计算已经成为IT真正的主流,今天创办一家公司,你需要大量的计算资源的时候,你想到的不是自己再去并购一个数据中心,再去买大量的服务器,而是利用今天已经有的大量的云服务的提供商他们所能提供的云计算。
中国的云计算能力这个市场是非常广大的,潜力是无限的,因为我再分享一个数据,IDC在去年年底做了中国公有云市场的报告,中国公有云市场,包括SaaS、IaaS,所有的公有云的市场收入的总量只占美国同类收入总量的3%多。但
但中国的互联网市场哪个领域我们只是美国的3%多?要么是跟美国同样的档次,要么比美国还要大。就算再小一点,我们至少是美国的一半,当你看到一个迅速成长的市场,今天市场的整个规模只有美国的3%的时候,你知道这个市场有多大,所以中国的云市场潜力无限。
最后我想总结一下,在我们谈企业服务的时候,尤其在谈新时代的企业服务,有三点我们要进行充分的考虑:
首先人工智能、大数据和云计算能力,会像以前所有的技术一样,任何一个新的技术出现,它的机会稍纵即逝,对于AI、大数据、云这样的现象级的技术的爆发,需要的是有非常前瞻的眼光,顺势而为的能力;需要很快的积累起我们的技术能力、工程能力;我们也需要有工匠精神,能够不断的改善我们的算法和分析能力,从而我们能够真正的为企业提供最好的新时代的企业服务。谢谢大家!