操纵世界的大数据:这家数据公司怎样帮特朗普(Trump)赢得了选举?
文 | Hannes Grassegger 、 Mikael Krogerus
一个叫 Michal Kosinski 的心理学家研发了一种基于 Facebook 活动详尽分析人们的方法。而一个类似的工具帮助唐纳德·特朗普(川普)取得了竞选胜利?两位来自 Das Magazin 苏黎世分部的记者对此进行数据收集。
这篇故事最早在去年12月发表于 Das Magazin。
起因
11月9日,8点30左右,Michael Kosinski 在苏黎世的桑内霍斯酒店醒来。这位34岁的研究员来瑞士联邦理工学院(ETH)做一场关于大数据和数字革命危险的讲座。Konsinski 在全球各种地方都开办这个讲座。他是心理测量领域的领先专家,心理测量是一个数据驱动的心理学分支。早上打开电视时,他看到了那个爆炸性新闻:出乎所有顶尖统计学家的意料,唐纳德·特朗普被选为了美国总统。Kosinski 盯着特朗普的胜利庆祝活动和来自每个州的结果看了很久。 他有预感,这个选举的结果可能与他的研究有关。 最后,他深吸一口气,关掉了电视。
就在同一天,一家当时名不见经传的设于英国伦敦的公司,发布了一新闻稿:
“我们很高兴,我们革命性的以数据为驱动的营销传播方式,在当选总统特朗普的胜利中发挥了不可或缺的作用,” Alexander James Ashburner Nix 这样说道。
Nix 是英国人,41岁,Cambridge Analytica 的首席执行官。 他总是完美地身着定制西装和设计师眼镜出现,金发卷发从前额向后梳好。 他的公司,不仅仅是特朗普在线营销活动的重要部分,而且也参与了英国退欧 (Brexit) 的运动。
这三个角色——反省沉思的 Kosinski,穿着讲究的 Nix 以及咧嘴大笑的特朗普——他们中,一个人启动了数字革命,一个人实践了数字革命,而一个人从中获益。
大数据有多危险?
在过去的五年里,只要你没有生活在别的星球,你都应该对“大数据”这个词耳熟能详。本质上,“大数据”意味着,我们做的所有事情,无论是线上还是线下,都会留下数字痕迹。我们每一次购物刷卡,每一次使用谷歌搜索,我们的手机在口袋里时我们做的每一个动作,每一个被存储的“喜欢”(“赞”)。尤其是“喜欢”。有很长一段时间,大家都不太清楚这些数据有什么用——除了,也许,我们会在搜索了“降血压”之后在浏览器上看到降血压治疗的广告。
11月9日,大家更清楚地知道了,这些数据有更多可能的用处。负责特朗普阵营数字营销活动的公司——也正是在“英国退欧”(Brexit)运动的早期阶段为 Leave.EU(退欧) 工作的公司——竟是一家大数据公司:剑桥分析 (Cambridge Analytica)。
要了解选举的结果——以及政治传播在未来将如何工作——我们需要从2014年,剑桥大学Kosinski 的心理测量中心里发生的奇怪事件谈起。
心理测量,有时也称为心理图像学,主要测量心理特征,如人格。 在20世纪80年代,两个心理学家组开发了一个模型,尝试用五种人格特质来评估人的性格,被称为“五因素”,即:经验开放性(你对新经验的态度有多开放?)、尽责性(你有多完美主义?)、外向性(你有多爱社交?)、亲和性(你有多善解人意和善于合作?)以及情绪不稳定性(你有多容易生气?),它们也被称为 OCEAN,即开放性、尽责性、外向型、亲和性、情绪不稳定性的英文首字母缩写。
基于这些维度,我们就可以对面前的人做一个相对准确的评估。这包括评估他们的需求与恐惧,以及他们会做出哪些有可能的行为。 “五因素”已经成为心理测量的标准技术。 但长久以来,这种方法都存在数据收集的问题,因为完成这个测量需要填写一份复杂、高度个性化的问卷。 不过很快,互联网就来了。 然后便来了 Facebook。以及 Kosinski。
2008年,当 Michal Kosinski 的生活展露新机时,他是一个生活在华沙的学生。剑桥大学,这个世界上最古老的机构之一,录取了他,同意他在心理测量中心完成他的博士学位。
Kosinski 的同学 David Stillwell(现在在剑桥大学法官商学院当讲师)当时在 Facebook 上推出了一个小的 APP,那时,Facebook 还不像今天这样庞大。大约一年后,Kosinski 加入了 David Stillwell。他们做的 MyPersonality APP 可以让用户填写不同的 心理测验问卷,包括五因素人格问卷中的一些心理问题(“我容易恐惧,”我爱反驳其他人”)。 基于评估,用户会收到一个“性格简历” ——个人的五因素得分——并可以选择是否与研究人员分享他们的 Facebook 资料数据。
Konsinski 本来预期会有几十个大学朋友填写他们的调查问卷,但没过多久,就有了成百上千,甚至数百万的人与他们在 APP 上“坦诚相见”。一夜之间,两个博士研究生坐拥了有史以来最大的数据集:心理测验得分与 Facebook 的档案。
接下来的几年里,Kosinski和他同事的研究方法其实非常简单。 首先,他们用在线测验的方式给测试对象发问卷。 根据他们的回答,心理学家会计算被访者的个人五大因素得分。 接着,Kosinski 的团队将结果与受试者的所有在线数据进行比较: 例如,他们在Facebook上“喜欢”、分享或发布了什么,或他们是什么性别,什么年龄,以及住在哪里。这些,让研究人员能够连接数据并进行相关性计算。
就算是简单的网上操作,也能从中得出十分可靠的推断。比如,“喜欢”化妆品品牌M.A.C的男性更有可能是同性恋; 异性恋的最好指标之一是“喜欢” Wu-Tang Clan。虽然这样一条单独的信息很弱而不能推断出可靠的预测,但是当几十、几百或几千个单独的数据点组合起来时,所得到的预测就变得相当准确。
Kosinski和他的团队不懈地改进着他们的模型。 2012年,Kosinski证明,通过一个用户平均68个 Facebook 上的“喜欢”,可以预测他的肤色(95%的准确性),他们的性取向(88%的准确性),以及他们倾向于民主党还是共和党(85%准确性)。但还远远不止于这些。 智力、宗教信仰以及酒精、烟草和毒品使用都可以确定。从这些数据中,甚至可以推断出某人的父母是否离异。
他们通过“准确地预测一个用户的答案”证明了模型的强大力量。 Kosinski 仍然孜孜不倦地继续完善着模型:不久后,光靠 10 个 Facebook 的“喜欢”,他就能够比一个人的工作同事更好地评价这个人。70 个“喜欢”能让他了解一个人胜过他朋友对他的了解,150 个“喜欢”能胜过他父母对他的了解,而 300 个“喜欢”能胜过他的伴侣。更多的“喜欢”甚至可以超越这个人对自己的认知。在 Kosinski 发表这些调查结果的当天,他接到了两个电话:一个诉讼威胁和一个工作机会。 两个都来自于Facebook。
仅仅几个星期后,Facebook的“喜欢”就变成了默认仅自己可见。在此之前,默认的设置是网上所有人都可以看到你的“喜欢”。但这对数据采集者来说并不构成任何障碍:不仅 Kosinski 总是会征求 Facebook 用户的同意,现在很多在线测试的应用程序,都以接入用户私人数据作为进行个性测试的前提。
但这不仅仅与“喜欢”或 Facebook 有关:Kosinski和他的团队,现在可以仅根据一个人在Facebook 上有的头像照片数量以及联系人数量(判断内向外向的很好标准)来归类这个人的五因素。但就算我们不在线时,我们也暴露了自己的一些信息。举个例子,我们手机上的运动传感器揭露了我们移动地多快以及我们旅游地有多远(这与情绪稳定程度相关)。Kosinski 总结到,我们的智能手机,就是一个广泛的心理问卷,无论有意还是无意,我们都一直在填写这份问卷。
最重要的是——这是关键 ——它可以反过来工作:不仅从你的数据可以创建个人心理资料,而且你的数据也可以反过来,被用于搜索特定的个体资料:所有焦虑的父亲,所有愤怒内向者,例如——甚至所有摇摆的民主党支持者? 基本上,Kosinski发明的是一种人肉搜索引擎。 他开始意识到他的工作的潜力,但同时也意识到了内在的危险。
对他来说,网络就像天堂来的一个礼物。他想要做的,只是回馈点什么,分享点什么。数据可以被复制,所以为什么大家不能从中获益呢?它是一整代的人灵魂。一个超越了现实世界限制的新时代的开始。 但是,Kosinski想知道,如果有人滥用他的人肉搜索引擎去操纵人怎么办?他开始在他的大部分科学工作上加上警告。 他警告说,“这个研究可能会对个人的幸福、自由、甚至生活构成威胁。” 但似乎没有人理解他的意思。
大约这个时候,2014年初,一个心理学部门叫 Aleksandr Kogan 的年轻助理教授找到了 Kosinski。他说他代表一个对 Kosinski 的方法论十分感兴趣的公司,并希望能够获权访问 MyPersonality 的数据库。 Kogan 说,他不能说出这个请求的目的; 他必须守口如瓶。
起初,Kosinski和他的团队考虑了这个提议,因为这意味着会为研究所带来一大笔钱,但后来他犹豫了。 最后,Kosinski 记得,Kogan 透露了公司的名称:SCL,战略传播实验室 (Strategic Communication Laboratories)。 Kosinski 谷歌了这个公司:“ [我们是] 最佳的选举管理机构,”公司的网站上写着。 SCL 提供基于心理模型的营销方案。 其核心点是:影响选举。 影响选举?Kosinski点击着页面,感到忐忑不安。 这是什么样的公司? 这些人在谋划着什么?
Kosinski当时不知道:SCL是一群公司的母公司。究竟谁拥有 SCL 及其下的各种分支机构,没有人清楚,因为它有一个极其复杂的公司结构,那种你能在英国公司注册所、巴拿马注册文件和特拉华州公司注册表中看到的公司类型。一些SCL的分支公司参与了从乌克兰到尼日利亚的选举,帮助尼泊尔君主反抗叛乱分子,而其他分支则制定了影响东欧和阿富汗公民对北约的方法。 而在2013年,SCL又拆分了一家新公司参加美国大选,这家公司就叫做:
剑桥分析 (Cambridge Analytica)。
Kosinski对这一切一无所知,但他感觉很不好。 “整个事情开始变质了,”他回忆到。 经进一步调查,他发现 Aleksandr Kogan 秘密注册了一家公司,并与 SCL 展开了合作。根据《卫报》2015年12月发布的报道以及根据 Das Magazin 的获得的其内部公司文件,事实上,SCL 是通过 Kogan 知道了 Kosinki 的理论。
Kosinski 怀疑 Kogan 的公司可能已经复制了他的基于 Facebook “喜欢” 的 五因素人格测量工具,并将其卖给了这个会影响选举的公司。他立即斩断了与 Kogan 的联系,并通知了该研究所的主任,这在当时的大学里引起了复杂的冲突。让该研究所为声誉忧心忡忡。后来,Aleksandr Kogan 搬去了新加坡,结了婚,并改名为 Spectre 博士。 Michal Kosinski 完成了他的博士学位,得到了斯坦福大学的工作机会,并搬到了美国。
“退欧”先生
大约过了一年风平浪静的时光。2015年11月,退欧(Brexit )运动中更激进的阵营 “ Leave.EU ”(由Nigel Farage支持)宣布,它已委托一家大数据公司支持其在线营销活动,这家公司就是:剑桥分析 (Cambridge Analytica)。该公司的核心优势即: 创新的政治营销——微定向——基于 OCEAN 模型通过分析人们的数字足记来测量他们的性格。
现在,Konsinski 会收到邮件来问他到底和这件事有什么关系 —— 那些词:剑桥、性格 和分析都让人马上想起 Kosinski 来。这是他第一次听说这个公司,而这个公司说,公司的名字来自于他的第一个员工和研究员所在的大学。他看着这个公司的网站,惊呆了。难道他的理论被大规模地用在了政治领域?
退欧运动结果出来后,朋友和认识的人纷纷前来质问 Kosinski:看看你都做了些什么。
无论他走到哪里,Kosinski都要向人解释他与这家公司毫无关联。(目前我们仍不清楚究竟剑桥分析与退欧运动牵扯有多深。剑桥分析并不愿意讨论相关问题。)
几个月来事情相对平静。 然后,在2016年9月19日,即美国大选前一个多月,Creedence Clearwater Revival的吉他即兴曲《坏月亮升起来》在纽约君悦酒店的深蓝色大厅响起。肯考迪亚峰会是一种微型的世界经济论坛。来自世界各地的决策者被邀请来到这里,其中包括瑞士总统 Johann Schneider-Ammann。 “欢迎来自,剑桥分析(Cambridge Analytica)公司的首席执行官亚历山大·尼克斯上台,”一个柔和的女声宣布道。 一个亭亭玉立身着深色西装的人走到了台上。台下骤然安静。很多在场者都知道,这,就是要负责特朗普(Trump)数字宣传战略的那个人。
(Youtube上有 Nix 当时的演讲视频:https://www.youtube.com/watch?v=n8Dd5aVXLCc)
几个星期之前,特朗普发了条意义不明的推文,“很快,你们就会叫我退欧先生。” 政治观察家们确实注意到特朗普的议程和右翼退欧 (Brexit) 运动的议程间有些明显的相似之处。 但很少有人注意到,这与特朗普最近聘用了一家名为 剑桥分析 (Cambridge Analytica) 的营销公司有关。
End.
转载请注明来自36大数据(36dsj.com): 36大数据 » 操纵世界的大数据:这家数据公司怎样帮特朗普(Trump)赢得了选举? | 上