联通沈可:未来大数据将朝人工智能方向发展
12月16日,以“Free Style”为主题的第四届蓝鲸TMT记者年会在北京隆重召开,这是国内一年一度最大的财经媒体盛宴,有超过500家媒体、自媒体齐聚现场参与互动和直播刷屏。上海联通副总经理沈可出席了本次年会,并针对大数据发表主题演讲。
沈可表示,从2001年有人提出“大数据”这个概念起,大数据这个词已有十余年历史。通过短短几年的发展壮大,现在大数据已成为人们生活中必不可少的科技。TMT板块中有很多高科技的东西,其中有很大一部分就是关于大数据。
对于大数据的应用,沈可指出,大数据最开始是通过统计分析进行精准的推荐,这个是比较低的层次。另外还可以通过关联分析找到大数据的连接价值,最高层次的大数据应用是通过时空分析预测未来的情况。
“我们现在按照这三层路径从一般性的精准服务到相互连接再到预测未来。事实上现在所有大数据在市场上的应用都是沿着这条道路在前进。”沈可称,目前,大数据在广告界、教育界有广泛地运用,此外,大数据在政务、安全、民生、产业、生态等方面也发挥着重要的作用。
谈及大数据的发展趋势,沈可认为,未来大数据发展的趋势一定是朝着人工智能这个方向发展,大数据一定会成为人工智能的基础。
附沈可演讲实录:
各位来宾大家下午好,在我演讲之前,必须先透露一个我跟毛老师不得不说的故事。在一周前毛老师第一次打电话的时候,说我们要开一个大会,邀请你过来一起参加。一开始我问他,要我去干吗呢?毛老师说你可以发表一次演讲,然后我问他你要我讲什么,毛老师说出了两个最让我痛恨的词就是随便。然后我当场就挂了手机不理毛老师,但是毛老师在过后的一周时间里面,翻看了我过去所有微博和微信的记录,他又给我打来电话,说我还是邀请你来参加蓝鲸的年会,我说这次让我讲什么呢?他说讲大数据,他讲到我的心坎里面,说明对我有了了解。但当时我还是特别犹豫,我说因为我是在上海工作,到北京去挺麻烦的,毛老师又说了三个字“有美女”,于是我就来了。
所以说在这个过程当中,在我们每个人的身后,你不知不觉的过程当中,有很多的数据和信息已经留在这个世界上。在你不经意的时候,你的个性、习惯、偏好已经留在这个世界里面,这是大数据的威力。所以在这个场合里,我和大家分享一下我自己最喜欢的一个领域,就是关于大数据的。
这里面我们有几个案例,第一个大数据能够做什么?现在最流行的一个词:“大数据可能比你自己还要了解自己”,所以在亚马逊上面讲,说我们现在人生活当中有35%的销售是与系统推荐有关的。我们每个人上新浪微博也好、上淘宝也好,都会看到一个栏目叫做“猜你喜欢”,其实这是系统根据你之前的行为做出一种预测。但如果光是预测这样简单的事情,不能叫做大数据很大的威力,它还能做更有意义的事情。
我们再来看一下巨大的阴谋论。这个阴谋已经到了我的翻译器上了,有人说你只要给我68个你在facebook上的痕迹,我就能把这个人的肤色、性向、政治倾向、智力水平、宗教偏好等一切信息都预测出来。
什么是大数据?大数据可以干什么?大数据的发展趋势是什么样?
大数据这个词已经有很多年的历史了,从2001年开始就有人提出大数据这个概念,到现在2017年底大概已经过了十几年,大家觉得这个技术发展十几年能到这个程度,是不是觉得太漫长?其实不是,像我们现在所使用的CDMA这个技术在1946年的时候就已经被人提出,直到2000年才被广泛应用,所以大数据通过短短几年的发展壮大,现在已经成为我们生活中必不可少的科技。最近一次恰好在一周前,我们最高领袖在参加学习的时候讲:推动实施国家大数据战略。刚才讲了TMT这个板块里面有很多高科技的东西,其中有很大一部分就是关于大数据,大数据到底意味着什么呢?
我们讲大数据现在是无所不知的大数据,对于我们在座任何人来讲,也许了解你比较困难,但对于大数据分析来讲我们只要知道四个象限就可以了,分类、分群、分域、分时。我们知道你是谁,你喜欢什么,你在哪里和你如何安排自己的时间。通过四分的方法可以把一个人在虚拟世界和现实世界中不为人知的部分还原出来,我们叫做打标签、建模型,还原一个真实的自己。
关于大数据还是有很多误区,因为大数据讲了很多,很多人讲什么是大数据,它能做什么?大数据有一个核心基础,这个核心基础就像开场的主任类似于快板一样的,叫做简单的模型加上海量的数据,我希望主任下一次一定把这句话念顺溜了。大数据有这样的特点,并不是指的多,而是指的全面,不需要抽样,它不追求因果关系而是追求关联关系。
目前大数据主要强调高效率,另外大数据的数据本身的价值要超过数据分析的价值,在这个基础上我们来看一下:大数据实际在很多科学家眼里是一种技术,但对于像我们这样的企业或者从事大数据工作的人来讲我更愿意把大数据定义成资产,就是我们现在讲的信息资产。后面讲的所有东西,通过某种技术手段可以让呆板的数据发挥出很大的作用,产生数据的效果。我们来看一下几个简单应用,大数据最开始就是通过统计分析进行精准的推荐,这个是比较低的层次。另外还可以通过关联分析找到大数据的连接价值,最高层次的大数据应用是通过时空分析预测未来的情况。我们现在按照这三层路径从一般性的精准服务到相互连接再到预测未来。事实上现在所有大数据在市场上的应用都是沿着这条道路在前进。
我们可以看到现在有几个重要的应用,一个是在广告界,第二个是在教育界,我们叫因人施教。这些领域都是现在大数据行业领域发展比较快,应用比较广泛,并且广泛得到好评的领域。除了刚才讲的以外,我们还可以看到大数据在政务、安全、民生、产业、生态方面发挥更大的作用。这里我们自己做大数据的时候,其实有很多案例,包括交通检测、防通信诈骗和环境治理。
这里我分享一个小小的案例,在座的各位可能最痛恨的就是打骚扰电话,接到不明短信。我们把它归类于防通讯诈骗这个环节,通过机器学习我们可以还原一个骚扰或者诈骗电话的模型,并且对他采取措施。实际上这里面又有一个新的问题,我们发现骚扰的人喜欢给陌生人打大量电话,每次通话时间非常短,并且他自己入话的频率非常低。机器按照这种方式进行学习,制定了一个模型。当我们第一次运行的时候,有一批人不幸地中枪,被第一批干掉了,但他并不是实施骚扰或者诈骗的人,这部分人是我们现在在北京街头日渐稀少的快餐送递人员。所以在这个过程中可以看到大数据不是万能的,它必须通过人的干预产生最大的作用。
最后,大数据发展的趋势一定是朝着人工智能这个方向发展,大数据一定会成为人工智能的基础。同时我们可以看到大数据还面临很多挑战,包括隐私的问题、信息高度集中的问题,产生的紊乱以及信息权利分配的问题。这些问题的出现正说明大数据越来越渗透到我们生活的每个方方面面,我们不断地在实践中加以探索来解决这个问题。
最后做一个简短的回顾,就是我们讲的大数据的概念,讲了它应用的方法,讲了它所面临的困难,其中最后我做一个自己的小广告,就是扫一下我自己的微信公众号,不管怎么样,大数据时代已经到来,如果要用数据就使用大数据,如果要做梦,就把这个梦做得大一点,谢谢。