Cambridge Analytica是一家怎样的公司?
Cambridge Analytica 是英国企业 Strategic Communication Laboratories 注册在美国的公司。以大数据挖掘和心理侧写(Psychological profiling)等技术手段提供信息精准投放策略为主要业务。目前最出名的案例为成功帮助英国脱欧公投阵营赢得脱欧公投和成功帮助Donald Trump川普击败Hillary Clinton希拉里赢得美国总统大选。
先回答问题:媒体利用该公司的技术是否能做到对读者的心理操控?
CA的Mission Statement为:
To deliver Data-Driven Behavioral Change by understanding what motivates the individual and engaging with target audiences in ways that move them to action.
可以说,CA并不对任何人直接进行“心理操控”,但是他们是通过采取不同的传媒策略(目前主要是社交媒体上的精准投放),对目标群体的行为进行干预。举个简单例子,分析并识别出潜在的但易动摇的希拉里支持者,在社交网络如Facebook上给他们精准地投放一些希拉里阵营的负面新闻。这些负面新闻帖子只有特定群体能看到,以降低他们投票支持希拉里的意愿。
所以简单来说,这是一家科技公司,但其所提供的服务具有极大的政治杀伤潜力。
要具体理解这家公司的业务,我们要先介绍一下心理学侧写(profiling)和心理计量学 (psychometric)。心理学上,有不少模型用于定量刻画一个人的性格。The Five Factor Model(又称the Big Five)就是一个最为经典的模型,这个模型用五个具体指标来衡量一个人性格的主要方面。下面列出这五个指标和一个大致的解释:
- Openness to experience(经验开放性,好奇和对新体验的接受程度)
- Conscientiousness(尽责性,是否容易被传统的目标驱动而专注工作)
- Extraversion(外向性,是否更倾向于活跃于社交场合)
- Agreeableness(亲和性,是否倾向于与群体达成一致和合作)
- Neuroticism(情绪不稳定性,对未知和压力环境的反应是否稳定)
这五项指标被简称为OCEAN,通过回答一系列调查问题,心理学家可以为每个人进行侧写,并建立一个OCEAN心理档案。类似的心理档案,可以用于评估一个人可能的政治倾向和面对特定事件的反应等等。心理档案侧写往往需要受访者相对认真和真诚地去填写一系列答卷,所以想要在受访者不知情的情况下,建立大规模的心理档案,传统上是做不到的。
在2013年,由剑桥大学计量心理学中心的Michal Kosinski和David Stillwell主导的一项研究提出了一个模型,使得不需要通过传统的问卷调查去作OCEAN侧写,利用读取一个人的Facebook上对不同页面的点赞(Likes),就能为一个人建立心理侧写档案。
他们首先在Facebook上开放了一个心理侧写的应用myPersonality,鼓励吸引用户去填写调查问卷,进行传统的心理学侧写(OCEAN),并获取相应用户的点赞信息。最终他们获得了美国58,466名志愿者的相应Facebook和心理侧写档案,作为一个训练的数据集。通过搜集一个新用户的点赞信息,并将之与训练数据集中的数据进行线性回归或者奇异值分解对比,不仅能对这个新用户的OCEAN档案进行预测,还能够对一些个人信息,如年龄、性别、性取向、婚姻状态、种族、政治观点、宗教信仰、生活满意度、是否酗酒、吸烟,乃至其父母是否在其21岁前离异等信息,进行准确的预测。
Kosinski自己对这个系统的描述为,了解一个人10个Facebook的点赞,足以让他对这个人的了解超越这个人的普通同事;70个点赞,则足以让他对这个人的了解超过这个人的朋友;150个点赞,那么他对这个人的了解可以到达这个人家长的程度;如果有超过300个点赞,那么他可以比这个人最亲密的伴侣更了解这个人。
在他们最初公布这一研究成果的论文中,他们提醒所有读者,不仅是点赞可以被用来建立一个准确的心理档案,一个人的几乎所有线上历史足迹,例如浏览记录和消费记录,都可以用类似的办法进行分析。并且这样的系统很有可能会被滥用,导致很多消极,甚至是恶劣的后果。
该研究结果受到了学术界极大的关注,最初引起了一些积极的,在学术框架内的争论。但好景不长,根据一些媒体的报道,Kosinski怀疑当时同在剑桥的Aleksandr Kogan(现改名为Aleksandr Spectre,为剑桥大学心理学系讲师)将这一研究成果商用,重新搜集了数据和搭建了一个类似的系统,并将其售给了SCL,也就是Cambridge Analytica的母公司。也许是由于对此不满,Kosinski在获得博士学位后离开了剑桥,目前在斯坦福大学任教。
一一一一一一一一一一
2014年7月30日,Cambridge Analytica成立。创立之初乃至2014年之前,就有不同的业务记录,例如14年的美国中期选举里就能找到CA的身影。而这家公司真正引起大家兴趣,是在最近,英国公投脱欧、川普当选美国总统之后。
德语周刊 <>12月3日刊登了由记者Hannes Grassegger和Mikael Krogerus署名发表的关于该公司的调查报道: Ich habe nur gezeigt, dass es die Bombe gibt – Das Magazin。该文后来被小幅修改,并被翻译成英文,以<>为标题,刊登于VICE的Motherboard板块: The Data That Turned the World Upside Down – Motherboard。这篇报道出来之后,该公司在相关领域内的知名度大增,但并没有引起更广泛的注意。
关于CA本身具体的业务和其他类似传媒或者大数据公司有何不同,CA官网给出了一个直接的解释:
传统的传媒策略和手段往往陷入了仅从地理和人口学的分类出发的陷阱,而CA是更着重于心理档案方面的刻画,CA称之为行为精准投放(Behavioral Microtargeting)。官网给出的一个例子就是,两个人的人口统计学分类可以是一致的,但由于这两个人的性格可能区别很大,同样的信息投放,对他们起到的效果可能会有天壤之别。而CA做的,是根据性格,而不是单纯的地理或者人口统计学信息去进行信息投放。
一一一一一一一一一一
在Ted Cruz参选初期,他面临了极多问题,例如人气的低迷,竞争的激烈和受众的巨大差异化。而在Cruz宣布放弃竞选前的2016年五月,他已经成为了川普的一个重要的竞争对手(仅次于希拉里)。如何能够做到这一点?
Nix介绍了CA在这里面主要用的三种方法,分别是 Behavioral Science(行为科学),Data Analytics(数据分析)和Addressable Ad Tech(精准广告投放) 。
首先,对于Behavioral Science,Nix强调,传统传媒公司还是在根据地理和人口学分类信息对受众分类, 但这个实际上是很不合理。例如,所有女性/富人/某个区域的某族群的人都应该接受相同的信息,因为他们有相同的地理、人口学分类么?这些当然重要,但更重要的是要按照受众的性格分类,因为人的行为更与人的性格而不是单纯的地域和人口分类状况相关,然后他便抛出了前文介绍的OCEAN模型。经过对数以万计的美国人进行OCEAN模型侧写,CA现在拥有了一个能够对所有美国人进行精准OCEAN预测的模型。
有了这个模型之后,CA可以根据OCEAN,有针对性地调整对每个不同个体的投放信息。例如关于禁枪议题,如果受众是更偏为理性且容易疑虑的受众(高H,C预测值),则对受众摆偏向令人担忧的数据,讲值得深入思考的道理,如果受众更保守,偏重传统(低O,高A预测值),则给受众讲枪支学习在家庭中代代相传的温馨故事。这样能够更高效地对具体的受众传达一个客户想要输出的信息。
第二,Data Analytics。 他认为,过往信息是一个由上向下,由一群极富创造力的人构思出一个宣传点子,然后直接推送给所有人以求获得共鸣的过程。传统的广告行业便是如此。但如今,在每个受众身上都能够提取上千个数据点,并用以分析具体哪一点对哪个受众更有吸引力的时候,传播应该转向由下向上的模型。
大数据,正是竭尽全力从所有源头获得尽可能多的这样数据点的,并最后分析形成一个干净清晰的且对受众有高度概括的过程。这些数据其中包括了传统的地理、人口分类学信息(事实数据)、心理测量学信息(态度,问题导向)和个性方面的描述(行为)。
Nix进一步强调,如果有必要,这样的数据可以直接精确到个人,CA掌握着对每个美国成年人平均4000到5000个数据点。
最后,精确广告投放。 Nix提出,大众传媒(Mass communication),这种所有人收到无差异化的信息的已经是过时的概念。人们再也不会收到,他们不关注,不关心的信息,而人们只会收到,高度定制的信息。以第一第二点为基础,CA可以根据受众的浏览器Coockies定制受众看到的在线广告,可以根据受众的兴趣爱好给受众寄送不同的实体广告邮件,电视台也可以播放专门针对受众关注点的节目,这一方面降低了投送信息的费用,另外一方面也极大提高了信息投送的效用。
Ted Cruz的大部分竞选宣传,都使用了这三招。结果呢?他的支持率从最早的5%,稳定上升到了35%。
紧接着,Nix说道,Ted Cruz退出了竞选。
但我可以告诉在场各位,剩下的两位候选人中,有一位选择了我们,继续沿用我刚才介绍的这一系列策略。至于7周后结果如何,我们拭目以待。
一一一一一一一一一一
此时此刻大家也都知道了最后的结果:川普当选。希拉里阵营固然也聘用了不少公关和媒体公司帮她采取各种手段以赢得大选,但其策略恐怕大多就是CA所批评的传统策略。川普一直指责美国大选是”rigged elections”(被暗箱操作的大选),之前最直接的解读为川普指责希拉里阵营操纵选举,但现在我们不妨认为这是川普真诚的自白。川普一直不重视传统媒体,在传统媒体上的投资和宣传不及希拉里十分之一,但却玩转社交媒体,被称”twitter治国”,相信CA在其中功不可没。按照媒体的报道,CA可能为此从特朗普阵营一共获得了1500万美金。
相信你如果读到这里,心中肯定会对问题“CA是一家怎样的公司”有了自己的答案。但这里要说明的是,虽然该公司自己宣称Brexit和川普当选是自己产品用于实战的成功案例,目前并没有足够的数据和证据去具体衡量CA的在这两起事件中发挥的实际作用。
Cathy O’Neil发表于2016年的《Weapons of Math Destruction:How Big Data Increases Inequality and Threatens Democracy》一书中描述了众多大数据能够如何促进不平等和威胁民主制度的可能和实例。很多人认为这其中有夸大的成分,但令人担忧的是,这本书揭露的,可能不及现实冰山的一角。
End.
转载请注明来自36大数据(36dsj.com): 36大数据 » Cambridge Analytica是一家怎样的公司?