Facebook事件背后,剑桥分析公司扮演什么角色
日前,由于Facebook平台用户的数据被非法采集和利用,一时间全球 社交 媒体 老大成为众矢之的,而随着整个事件的始作俑者剑桥分析(Cambridge Analytica)公司更是遭到口诛笔伐。那么我们今天去除上述事件中“恶”的一面,仅从AI技术、市场应用的角度来看剑桥分析可能会得到另外的启示。
众所周知,所谓剑桥分析采用的对于搜集到的个人信息分析的计算模型最初是来自于迈克尔•科辛斯基(Michal Kosinski),其是心理测验学(一个由数据驱动的心理学分支)领域的领军人物,其发明的个人信息计算模型可以根据简单的个人信息就推断出该数据提供者可靠的个性特质。究竟有多可靠?
早在2012年,科辛斯基就证明,平均基于Facebook上的68个“点赞”,就可以预测用户的肤色(准确度95%)、性取向(准确度88%)以及政治倾向(民主党或共和党,准确度85%)。可预测的内容远不止于此,还包括智力、宗教信仰,以及酒精、香烟和毒品使用。
基于数据,科辛斯基甚至可以推断某人的父母是否离婚。而在不断研究和改进后,其模型变得日益完善,即仅仅基于10个点赞,他就能比受试者的同事更准确地评价受试者;70个“点赞”足以让他比受试者的朋友更了解受试者。
150个点赞可以让他比受试者的父母更了解受试者;300个点赞可以让他比受试者的合作伙伴更了解受试者。基于更多的点赞,科辛斯基对受试者的了解,甚至超过受试者自己。之后,科辛斯基等人开发了一种非常简单的方法。
首先,他们以在线测验的形式向测试对象提供问卷。根据他们的回答,心理学家计算了受试者的个人“大五”(开放性Openness,对新经验的开放程度、尽责性conscientiousness,完美主义程度、外向性extraversion,社交活跃程度、随和性agreeableness,体贴和合作程度和情绪稳定性neuroticism,焦躁不安程度的简称,又称为OCEAN)分数。
然后科辛斯基的团队将结果与受试者的其他在线数据进行比较,例如,他们在Facebook上“点赞”、分享或发帖的数据,以及性别、年龄、居住地点等数据。这使研究人员能够建立特定网络行为与个性特质之间的关联。
不知业内,尤其是那些整天把大数据、AI挂在嘴边的企业作何感想?我们看到的是,如果AI真的发挥作用,如何理解AI专攻的领域及在相关领域的专家至关重要,尤其是针对这个领域基础理论的了解和研究一定要透彻、扎实,因为这直接影响到计算建模的水平和其输出的结果(是否真的具有价值)。
那么以此作为标准之一的话,我们国内号称自己是AI企业的有多少是合格的?又有多少是浑水摸鱼的?也许就像我们有的业内人士所言,我们偌大国家不缺少用户的数据,但如果技术不过硬,这些数据又有何用呢?又有什么值得炫耀的?
其实此前,某些号称采用AI技术的国内企业在向所谓的目标用户推送内容、广告、服务的时候已经引发了用户的不满,甚至闹出一系列的笑话,原因很简单,就是推送的这些根本不是这些用户所需要的,更反映出这些企业AI技术与人家的差距。
如果说科辛斯基为某种AI应用奠定了坚实的技术基础,那么此次被曝光的剑桥分析公司则是为这种技术找到了最佳的应用并实现了最佳的效果,即政治选举。这也是为何外界又称剑桥分析是政治AI公司的原因。
例如在欧洲,剑桥分析帮助曾在上世纪80年代获得成功的复兴政党参与了2012年意大利政治竞选活动,而其改革建议使该党的表现超出了最初的预期;2014年帮助乌克兰展开颜色革命,使亲西方总统维克多•尤先科(Viktor Yushenchenko)掌权。
在肯尼亚,剑桥分析公司曾两次用于帮助肯尼亚总统乌胡鲁•肯雅塔(Uhuru Kenyatta)先后在2013年和2017年获得选举胜利。当然除此之外,最大应用就是其在英国脱欧的投票中让英国脱欧及特朗普在美国总统大选中击败希拉里当选。
提及美国总统大选,我们补充说明的是,其实除了特朗普,其竞争者希拉里也采用基于大数据的AI分析,即与来自蓝色实验室(BlueLabs,2013年在华盛顿创办的一家数据分析和技术公司,创办人包括奥巴马数据团队的高级成员)的前沿大数据分析师合作,并获得了谷歌和梦工厂(DreamWorks)的支持。
甚至当特朗普于2016年6月宣布聘请剑桥分析时,希拉里阵营还嘲笑该公司AI分析准确性肯定不及本土的蓝色实验室。但最终的结果证明,这两家同样基于AI技术的分析公司,显然剑桥分析更高一筹,这似乎再次证明了AI技术本身与适用市场的重要性。
不过这里我们再次强调,我们坚决反对和谴责剑桥分析干预别国政治的做法,只是借此说明AI要真正发挥价值和作用,技术过硬和应用对口(要易于最大化技术的价值)的不可或缺。
相比之下,还是我们国内的某些AI企业,总是把自己的AI技术吹得天花乱坠,无所不能,其实针对不同的行业,不同的市场,AI也是有专攻的,盲目的选择应用和市场,不仅事倍功半,甚至有噱头的嫌疑。
最后就是通过剑桥分析,我们重新认识了英国在AI领域的实力。其实,AI不仅是美国在引领未来。过去十年,英国一直是欧洲AI的研发中心,AI 创业 公司屡获谷歌、亚马逊、 苹果 等巨头青睐,并购和 投资 消息不断。这里我们不妨简单看看英国在AI方面有哪些知名的公司或者初创企业,它们在干什么?
提及“阿尔法狗”打败世界围棋冠军李世石成为大量媒体的头条新闻,相信有部分人会认为这是谷歌AI牛逼的代表,实际上“阿尔法狗”的开发商是成立于2011年的英国DeepMind公司。
该公司由神经系统科学家Demis Hassabis、网络语音通讯软件Skype开发者Jaan Tallin和研究人员Shane Legg共同创办,是前沿的人工智能企业,其将机器学习和系统神经科学的最先进技术结合起来,建立强大的通用学习算法,只是在2014年被谷歌以4亿美元收购。
再看当下火爆的自动驾驶,除了经常见诸报端的美国 科技 企业谷歌、Uber、特斯拉外,其实英国在自动驾驶上也早有涉足。例如2014年末从牛津大学机器人团队中衍生的Oxbotica公司,就专注于机器人和自动驾驶 汽车 工程技术的研究。
其开发的自动驾驶软件Selenium可以通过搭载的视觉摄像头、激光扫描器或者雷达系统获得数据。通过一系列算法确定自身的位置和周围的环境状况,进而判断下一步的行动,实现自动驾驶。该软件系统具备自主学习能力,它会在行驶过程中收集数据并进行分析和学习,以此训练感知系统并获得自主驾驶能力。
此外,剑桥大学SegNet研究小组,其开发的高性价比的自动驾驶识别系统SegNet,具有低成本低特性且不需要任何GPS连接,无论是白天还是黑夜,都可以正常工作。一旦SegNet系统启动,便可临时接管汽车的基本操作,这一功能与部分车辆的自动驾驶功能类似。
SegNet系统还可识别道路、建筑物、电线杆、路牌、行人和骑行者等12类标注。可保持实时工作状态并在较短时间内对各种新图像进行评估,精确度高达90%。
更让我们吃惊的是,英国现在已经开始研究量子计算与AI的结合,而Cambridge Quantum Computing Ltd.就是一家在量子信息处理技术,人工智能,优化与模式识别相结合的领先独立公司。
该公司开发可实现当前或未来工业的技术,专注于量子器件的算法和数据协议。该公司目前关注的领域包括:量子操作系统与量子模拟、认证随机性、人工智能、安全认证和量子对抗加密货币。
看到这些,再结合近期外媒屡屡发文称中国AI水平正在赶超英美,我们是否应该冷静下来思考,这背后的目的究竟是什么?实际的情况又是怎样?
综上所述,我们认为,当业内将目光纷纷聚焦到Facebook和与之相关的剑桥分析非法搜集和利用用户数据用于左右别国政治选举负面的时候,我们不妨站在AI产业的高度,从技术和应用的角度去看待这一事件,提取出对于我们AI产业发展有利的启示也同样具有重要意义,毕竟任何事物都具有两面性。
(来源:钛媒体 作者:孙永杰 )