美国大数据专家安德雷斯·韦思岸:大数据就是未来的新石油
互联网时代,数据无处不在。当我们使用搜索引擎,在微信与人互动,或享受打车软件的便利时,都在产生和分享社交数据。数据总量的指数增长让人们觉察:数据为我们造福的时代已经到来。
近日,《大数据和我们》由中信出版集团出版,作者安德雷斯·韦思岸(Andreas Weigend)是美国大数据和消费行为专家。近一段时间,他正携自己的新书在北京、上海等城市作巡回演讲,传播他的数据心得。近日,长江日报记者在上海专访韦思岸,他结合研究和观察告诉我们,数据将让我们的生活变得更有质量。
写书劝大家分享隐私
韦思岸曾任美国亚马逊首席科学家,在斯坦福大学、加州大学伯克利分校及复旦大学任教。过去10年来,他保持着一个习惯,将自己的每一场讲座和演讲,以及乘坐的航班信息都发布在个人网页上,甚至包括航班座位号。“我相信,分享数据可获得实际价值”。
身处大数据前沿,韦思岸发现一个现象:人们非常害怕失去隐私,不停抱怨隐私被人窥探,却又想得到更多、更精细的服务。“必须写本书告诉人们,这种思维要改变。”2012年韦思岸就萌生了写《大数据和我们》的想法。
韦思岸提出,在社交数据泛滥的世界里,旧的规则已不适用。收发电子邮件、上社交网站、打开导航系统、使用计步器等感应装备、用手机查天气预报等普通行为都会产生数据,并被数据公司记录。通过提炼这些数据,可以发现人们的偏好或倾向,还能做出预测,比如人们可能会购买何种商品等,基于分析结果,能为用户提供贴心、实用的服务;相应的,普通人也能因利用数据受益,“我们可以基于这些数据做出决策,让数据为生活服务”。
“100年来,我们一直珍视隐私权,但现在,我们必须认识到,隐私权其实只是一个幻象。”韦思岸通过自己的书告诉大家,数据公司对我们个人数据记录得越多,我们的存在感越强,更利于作出准确的决策。“如果你希望从数据中获利,就必须分享自己的数据”。
“猜你可能还想买”的创意来自他
如今,我们在网上购物常常可以看到“猜你想买”“你可能还想买”之类的提示,最先想到提供这种服务的人正是韦思岸。
2002年的一天,韦思岸接到亚马逊首席执行官贝佐斯的一个电话,对方表示想雇佣他。“人们会好奇,为什么会有人雇佣一个物理学博士来做电商呢?因为物理学家知道怎样做实验,怎样收集数据又怎样解读数据”。
担任亚马逊首席科学家期间,韦思岸与贝佐斯共同制定了该公司数据战略——以客户为中心。韦思岸主导开展了一系列实验,比如比较哪些商品评论更能让客户开心,用哪种方式为客户推荐商品成功率更高等。他还分析顾客与网站达成的每一桩交易,分析他们的购买地点、商品品种、消费金额等数据,进行分析得出结果,可用于为顾客推荐合适的商品。于是,亚马逊在此基础上开发了自己的商品推荐系统。
“猜你想买”,亚马逊的数据挖掘改变了10亿人的购物习惯。
在过去10年中,韦思岸还为汉莎航空、百思买、腾讯、阿里工作。“经验告诉我,在这个时代,人们正在将数据转化为服务”。
想办法让数据分享变得平等
“当我们认识到数据的价值后,重点不仅是获得数据,而是要主动行动。”韦思岸发现,因为技术差异、信息不对等,现实生活中,普通人想与企业实现数据平等分享很难。如何避免社交数据被滥用?韦思岸认为,透明性与主动性原则最能保护我们免受伤害,提高我们从中得到的价值。
“你需要了解你提供的数据与你得到的数据是否对等。”在《大数据和我们》中,韦思岸教读者如何与企业客服打交道:当我们打通客服电话时会听到“为保证服务质量,本次通话可能会被录音。”我们应该对他们说,我也会为此次通话录音,以保证我所获得的服务质量。
前不久,在“2016陆家嘴金融全球峰会”上,韦思岸在演讲中分享了个人网络用户的6项权利,为普通人合理利用数据支招。
首先是查看数据、获取数据的权利。比如在淘宝网上查看所有的交易记录、购物趋势以便你做出更好的选择;第二是看到数据加工的过程,我们可以分析百度是如何进行数据汇总、提炼的,也可以观察蚂蚁金服是怎样计算你的积分,以便帮你做出更好的决策。
再就是修改数据的权利,也就是你有权对自己的数据增添删改。你还可以将数据模糊处理,根据用途决定所提供数据的精度,比如分享自己的位置是精确到方圆1米还是1公里,求职时个人信息提供是否需要面面俱到。
“事在人为,只要你愿意。”他说。
访谈
“每个人都可以成为数据高手”
安德雷斯·韦思岸
“数据用不好不是技术差,是因为惰性”
读+:你经常为企业出谋划策,但在书中你更多站在普通用户一边,这是为什么?
韦思岸:确实,我有很多在企业工作的经验,越是这样,我越觉得,如果没有普通人利用它们产生的数据,这些企业将失去存在的意义。比如,人们如果不是体验到在亚马逊购物的便利,在这个平台购物,亚马逊不会存在。
以前,我花了很多时间在如何帮助企业善用数据上,让客户能得到更多快乐的体验。大数据会引起巨大的革命。以前,我曾看过一本叫《身体和我们》的书,我认为,数据和我们的关系在今天如此重要,不亚于身体对我们的重要性。
读+:你提出人们要努力培养“数据素养”,那是个什么素养?
韦思岸:不能充分、有效利用数据,是不是因为人们不够勤奋、不够聪明呢?不是,其实是因为惰性。在做一件事时,人们通常会选择最简便、快捷的方式,而忽略了很多更重要的事情,比如安全。很多人将银行卡、电脑密码设置成123456,这样做隐患很大。
“数据素养”不是指素质或习惯,而是一种自觉的意识。包括了解数据服务商的工作机制,知道哪些参数可以改变或不可改变,善于改正错误,了解不确定因素,以及分享社交数据可能会带来哪些结果等技能。在当今世界,数据服务商的推荐意见、分析结果对我们大多数决策都有引导作用,因此数据素养必不可少。
数据是新世纪最重要的原材料
读+:你新书封面有一句宣传语“数据是未来的新石油”,数据与石油有何联系?
韦思岸:在今天,让数据为人类造福的需求具有无以复加的重要性。作为21世纪最重要的原材料,数据就是石油。
一个多世纪以来,石油的发现、开采技术的进步,对社会、经济产生深远影响。人们通过提取、储存和精炼,把石油变成人类需要的各种产品。现在,由原始数据转变而成的产品和服务,正在改变我们的生活,其影响力足以与工业革命媲美。
读+:但数据和石油毕竟有不同之处吧?
韦思岸:石油总量是有限的,剩余的石油资源越少,开采成本越高。与之相反,数据量呈指数增长趋势,而数据交流与处理所需的成本却在不断下降。我们每次使用电话时,就会产生数据,与石油不同,数据永远不会枯竭。
此外,一份原油只有一个实体拥有使用权,或只能提炼一种产品;而一个数据库,多个实体可以同时接入,并且创造出多个不同的产品。
读+:数据必须加工才能为我们所用吗?
韦思岸:很对,不是所有的数据都有用,有些数据会迷惑、误导我们。前不久,我知道有“东北大拉皮”这道菜,但我不知道菜名的意思,当我用网络工具翻译这个词时,让我吓了一跳——“东北的皮肤”,显然,我得到的数据不适用。
数据是有时效的,比如我今天在上海,这个数据只是暂时有效,当我过几天离开后,这个数据就是无效、错误的。同样,大众点评网、淘宝网也有很多不实的评价。
因此,我们在利用数据时,还要了解更多相关数据,作为辅助,并尽可能精确。你还应该知道哪些数据合情合理,哪些数据是虚假的。人不要被数据主导,而应以需求主导。
因为害怕泄露隐私而封闭自己不可取
读+:“猜你想买”的确帮助人们开拓了购买想象力,但也让很多人心理不适。你怎么看?
韦思岸:解决这样一个问题,可能更多需要心理学家参与,而不是数据科学家。如何在隐私的共享得到好处,而不至于被侵犯?要分清何时需要提供,何时需要说不。在提供隐私数据时,我们要了解,隐私的提供能给自己带来多大好处,与自己所需要的服务有没有相关性,你不需要提供不必要的隐私。比如,打车软件需要了解你的位置、目的地很正常,但如果需要你的婚姻状况,那便是侵犯隐私,你必须拒绝。
读+:当用户在网上提供个人信息,让自己得到更好的服务的同时,却也给犯罪分子提供了可乘之机,这矛盾如何解决?
韦思岸:这其实是两个不同的问题,我们应该区分隐私利用和网络犯罪的含义。
当用户向企业提供自己的隐私,以获得更好的服务,那么,这些企业必须对你所提供的信息负责,让它很难泄露,包括防范黑客攻击。
但是不是因为隐私有可能泄露、共享,我们就拒绝提供呢?不能一概而论。在很多情况下,你向企业提供了个人数据,虽然有些数据被用来企业间共享,但大都会给你带来回报——更高效的服务、更少的花销,这便是隐私利用;但企业不注意网络安全保护,黑客可能盗用账户密码,或冒用用户身份证贷款,造成严重经济损失,这又是另一个层面的事了。
有人会说,我们提供隐私数据需要索要报酬,其实他们已经得到了报酬。比如美国某网站将所有利润分给用户,每名用户当年可分得3.5美元,那么,一个好用的社交平台在你心中的价值是不是高于3.5美元呢?
如果你回答是,那么,已经有人为你的数据付费了。
读+:如今,很多企业在搜集、整合、分析人们的数据,需要担心吗?
韦思岸:与其担心不如从容,因为你的担心是没有用的,你永远无法知道那些数据服务商有多强大。我们可以把社交数据的挖掘程序视为神秘的“黑匣子”。我们不应花费精力去担心数据可能被企业利用,而应该全神贯注,充分利用数据服务商的产品,使数据分享尽可能在积极与消极间取得平衡。
普通人也可让数据发挥神奇作用
读+:普通人利用数据的能力小得多,渠道也很单一,难道我们只能甘于处于下风、被动状态吗?
韦思岸:事实并非这样,普通人也有能力去发掘一些看起来不可思议的数据。
美国旧金山有家数据公司,它掌握了大量职场人士信息,包括他们的工作经历、业绩、财务状况等,以此为其他公司提供有偿服务。但是,这个关系是可以反转的。如果你的信息被他们掌握并利用,你就可以通过信息的输出渠道、经过找到有用数据,再将这些数据整合、分析,你能知道这家公司的工作方式、数据的用途和输出方向,并有可能窥探到更多企业的信息,为自己所用。
世界很奇妙,数据在产生、使用上总是双向的,我们要学会在数据背后挖掘更多更有用的信息。
读+:未来,当我们充分利用数据时,还会有哪些惊喜?
韦思岸:这需要问我们自己了,除得到买东西更物美价廉,求职交友更靠谱等等之外,我们还需要什么?还期待数据给你带来怎样的惊喜?
对于个人来说,数据最大的价值是帮助你作出更正确的决策,这适用于任何时间、任何状况下。所以,数据几乎能及你之所及的,只要想得到的,数据都能办到。但前提是你必须学会整合数据——利用一切可用的信息。通过整合,能找出更多隐藏的信息,为我们服务。(宋磊 赵媛)
︻手记︼
数据侦探
圣诞节前一天,记者走进韦思岸上海的家。他将一个小盒状仪器接通电脑,并告诉记者,“我乐意将自己的生活公之于众”。
2012年,韦思岸买下上海某居民小区一套约80平方米的房子,每年都会在此住一个月。除了到大学讲课、到企业分享数据经验外,他会用滴滴打车、大众点评和微信。在他看来,在不同国家体验不同的社交网络平台、不同的数据共享感受非常必要,也很有趣。
韦思岸的工作台相当拥挤,并排摆了三个液晶显示器,一台平板电脑,平时,他会在这里上传数据、搜索数据。“相比数据科学家,我更愿意把自己称作数据侦探”。
韦思岸具有一种能力,能在浩如烟海的数据中甄别优劣,找到真正有用的数据。他知道数据来源,也知道数据间的关系,在他看来,数据科学包罗万象,涵盖生物学、商业、心理学等方方面面,“要厘清各方面的关系,必须充满好奇心”。
采访结束后,韦思岸把记者带到他的电脑前,打开某搜索引擎,展示他近10年任意一天的行踪,如数家珍。他还打开某知名网站,展示他的朋友、朋友的朋友,并翻出多年前的聊天记录,开怀大笑。
“太不可思议了,那些并不相干的人们,通过数据产生联系,并共享数据带来的好处和惊喜,我有幸参与其中,妙不可言。”他说。(宋磊)
注:本文摘自长江日报,作者宋磊 韩笑 赵媛,转载注明出处,欲了解更多大数据行业相关资讯,可搜索数据观(中国大数据产业观察网www.cbdio.com)进入查看。
责任编辑:汤德正