数据观专访邓白氏高级副总裁:大数据的发展趋势就是我们具体想要什么
大数据的发展趋势就是我们具体想要什么
——数据观专访邓白氏公司高级副总裁Anthony Scriffignano
数 据的开放共享,数据安全和保护一直是国际上热议的话题,我国也非常重视大数据产业的发展,在数据的开放共享上,我国各地也不断出台各种政策,旨在促进大数据的快速发展,然而数据的质量和安全问题却束缚了我国大数据行业从业者的手脚,使其不敢完全放胆干。然而国际上有些国家的数据开放共享做的比较超前,是我们可以借鉴的对象。
5月25日,2017数博会期间,数据观记者有幸就数据开放、数据安全以及政策等相关问题采访了邓白氏公司高级副总裁兼首席数据官Anthony Scriffignano。他在信息技术、四大管理咨询和国际商业方面拥有超过35年的经验并拥有丰富的数据知识,也曾多次就全球数据科学的新兴趋势发表观点。
Anthony Scriffignano首先谈了对大数据行业发展趋势的理解,他认为大数据是一个很宽泛的领域,我们往往想要将其局限化,其实这是不对的。世界上有太多的数据,如医疗数据、建筑数据、环境数据等,每种数据都有其挑战性,在问大数据的发展趋势之前,我们必须清楚的知道这些数据是否完美,这些数据在10年前就有了名称,我们现在也能看着这些数据的分配。此外,我们也可以从世界各地获得新的数据,但是一个简单的问题,你是否明白那儿具体有多少人?有多少商业公司在那?我只能说祝你好运。对我而言,这些问题我都无法回答,我无法回答如何使经济更好,因为这个问题太大了,但我能回答类似我们如何生产更好的产品,这才是正确的问题。想了解一个问题,我们必须清楚我们想要的具体方向是什么,把问题具体化才是我们需要考虑的问题,大数据的发展趋势就是我们具体想要什么。
• 数据保护
随着互联网的普遍,我们越来越依赖移动设备,当我们使用app时,我们的数据总是被默认为允许使用,这在一定程度上,造成了我们个人隐私数据的泄露的危险。针对此问题,Anthony Scriffignano给出了自己的见解,他认为对于个人隐私数据而言,其实有些是可以开放出来的,过度的规范数据的使用,其实是很危险的事,比如我们的个人医疗数据,这些可能只有我们的医生才知道的数据,但是当他们遇到一个医疗难题时,其实需要成千上万的患者数据,以此去找到最好的解决方法,这样的数据被开放出来是很有意义的。再比如,当我们在使用别人的产品时,在我们登陆或退出的过程中,我们的数据就被收集了,但这些信息只是为了让他们把产品做的更好,让我们的体验更好,或者让产品更优化,这些其实都是有意义的,但这些应该建立在被我们允许的基础上。然而这并不意味着我们个人的基本信息数据应该被公开,比如我们的银行卡、身份信息等,我们应该保护我们的隐私数据不被商业化。
此外,他认为信息的泄露应该是行为问题,而不应该只是隐私数据保护问题。可能有些公司愿意花钱去买这些数据,你可以同意,也可以不。但是有一个大问题,就是当人们知道他们的数据价值后,他们实际上可能愿意分享他们的数据,当他们在购物时被询问到,这样数据收集者就不需要去支付了,但很多时候,我们的数据可能会被非法利用,这是我们应该要保护的,但对于我们当前的数据保护,其实是远远不够的。其中的难点之一,是我们无法确认有多少数据被创造出来了,你知道每一个国家都拥有各自的经济体系,但他不认为我们能在很短的时间里全部理解这些数据价值。
• 数据开放
对于政府数据的开放共享,首先需要明确政府数据不一定只是政府部门的数据,有大部分数据其实是企业数据,只是被他们收集而已。这就很好理解为什么有些数据是对每个人都有用的,一个简单的例子,上市公司的数据是复杂的,他们热切的渴望掌握更多的客户信息,而这些数据可能就被掌握在政府手中。
此外,政府数据的开放,有助于我们清楚了解政府的财政费用被用在了哪些建设方面,但是我们却并不能完全的知道下一步政府的消费方向,因为这是危险的。那些数据是对我们有用的,是清晰易懂的,才是政府应该开放的数据,而不是全部。
一个简单的案例,在天气方面的数据收集,这几乎是完全公开的,我们几乎不需要任何帮助,就能知道室外的天气情况,这些数据都是真实的,比如台风什么时候会来。如果我仅仅只是看天气地图,其实我们是不能完全理解这些数据的,我们需要别人的告诉我它们代表什么。Anthony Scriffignano认为政府开放的数据应该是简单易懂的,没有被错误使用且真正有用的。像是你头疼,你去药店知道自己要买的是阿司匹林,但是其他问题还是应该去找医生,你需要明确问题的本质是什么。
然而,我们产生的数据时刻变化着。但你可以去参考GDP数据,这是一整年的数据,但这些数据只能代表过去,对于当前你要做的事可能没有任何意义,这也是政府数据开放的难题之一。
• 场景应用
应用场景是业内人士一直在谈论的话题,也是大数据行业从业者一直在努力的方向。但Anthony Scriffignano认为大数据应用的场景不能局限在某个领域,而是要考虑大数据在应用上的创新,主要可以从四个方面来解释,分别是用新的方式做新的事、用新的方式做旧的事、用旧的方式做新的事以及用旧的方式做旧的事。
用旧的方式去做原本已有的,这不是创新,而是传统。而将旧的东西以新形式出现,比如我们所熟知的uber,以及中国的滴滴等,这些都属于创新。他认为用原来的方式去做新的东西是非常有趣的,比如驾车,现在的车没有驾驶者也可以行使。而我们现在就一直在不断的尝试各种不同的方式以达到创新的目的。
✎ 数据观采访感悟: 数据的开放共享,其实不只是技术上的难题,还有数据安全和数据质量等方面的问题。数据开放之前,我们必须明白什么样的数据是能够开放的,以及开放的意义是什么。我们个人的隐私数据不应被公开和泄露,比如我们的身份信息等。但是有些数据的公开是很有意义的,比如我们在使用产品时,我们的数据被默认使用,这其实有助于产品开发者去优化产品,有助于提升我们的使用体验,但我们也需要采取措施去保证我们的这些数据不被商业化。自大数据概念被提及以来,业内人士,以及对大数据感兴趣的人,都在讨论它的应用场景,而他们也一直在这方面努力着,总而言之,其实离不开创新,不管是用新的方式去做新的事,还是用新的方式去做旧的事,其实都是在了使我们的生活更便捷、更健康。
注:本文来源数据观,记者:余超蓉,编辑:Fynlch(王培),转载请注明来源及作者信息。数据观微信公众号(ID:cbdioreview) ,欲了解更多大数据行业相关资讯,可搜索数据观(中国大数据产业观察网www.cbdio.com)进入查看。
责任编辑:王培