从Facebook泄密,看大数据背后存在哪些“技术黑箱”?
社交网站巨头Facebook因数据泄密陷入了前所未有的信任危机。4月10日(美东时间)起,扎克伯格一连两天出席美国国会参众两院听证会,回应公司挪用“脸书”用户数据丑闻。扎克伯格承认“脸书”管理不善和“太理想化”,就数据外泄事件向公众道歉。实际上, Facebook 面临的各种问题依然严峻,在这条自我救赎的路上,扎克伯格要做的还有很多。
而透过Facebook数据泄密事件,未来如何加强对用户信息保护, AI背后的代码、算法存在的“技术黑箱”,以及应对大数据技术应用中所带来的各种法律问题显得尤为重要。
互联网企业缺乏
对个人信息保护意识
大数据与云计算的结合,可以作为分析用户行为、偏好、信用等的有力工具,但在商业利益的驱动下可能产生负外部性,衍生出危害个人信息安全甚至国家信息安全的恶性事件。大数据环境下,用户的操作行为、视频、文件、图片等几乎所有的数据都能为企业所用,但在此过程中面临着如何保护个人隐私、维护个人信息安全的问题。
此次事件中,Facebook受到指摘的一个重要原因就是“未能保护好数据”,存在主动向第三方开放API之嫌,使得个人敏感信息成为政治定向广告摆布民意的工具。实际上,于2018年2月12日,柏林法院就在“德国消费者组织联合会诉Facebook”案中裁定其违反德国《联邦数据保护法案》,具体包括收集和利用个人信息并未实现取得数据主体的同意而默认开启、预先拟制同意声明、强制要求实名制条款。可见Facebook在数据的全生命周期中,即数据的收集、存储、处理、使用、删除等过程,并未对个人信息保护提起重视、履行责任,而这也是目前中国很多互联网企业的现状。
基于此,2017年中国人民大学国发院金融科技与互联网安全研究中心配合中国互联网金融协会制定“用户数据在移动金融中的收集与使用行业标准”,并于今年年初与南都个人信息保护研究中心合作完成《2018移动金融用户个人信息安全测评报告》,旨在推动数据应用的法治化、规范化,呼吁相关行业参与者将用户个人信息保护视为企业持续发展的根本保障,加强行业自律。
利用大数据“杀熟”
涉嫌违反《反垄断法》
从今日头条智能算法带来的个性化展示到网曝在线旅行平台利用大数据“杀熟”,流露出的是大数据应用绝非中立,机器学习尚不成熟。本应“懂你但不认识你”的大数据技术演变为“懂你并且利用你”,在分析消费者支付能力、消费偏好后,针对不同情形定制不同价格,例如判定急需订票便提高价格,固定路线叫车报价更高等。
大数据“杀熟”违背商业诚实信用原则自不待言,更有违反反垄断法之嫌,可能构成价格歧视。根据消费者愿意为每单位商品付出的最高价格而为每单位产品制定不同的销售价格被称为完全价格歧视或一级价格歧视,现实中由于企业通常无法知晓每个消费者内心能够承受的最高价格,因此很少发生,但借助大数据和人工智能算法,能够对每个用户进行全方位的精准画像,并在分析预测的基础上予以歧视性定价。此种方法削减了消费者对互联网商业场景的信任度,使原本便利普通民众生活的大数据技术成为谋利的手段,将危害行业发展、阻碍技术进步。
不仅如此,机器学习模型可能导致种族或性别等方面的歧视。从输入数据到作出决策的机器学习中间过程,甚至更为先进的自动学习,AI背后的代码、算法存在着超乎我们理解的“技术黑箱”。而提高发展非歧视性数据挖掘技术是一个尚未解决的研究领域,目前应当提高大数据算法应用的信息披露义务,并且运用监管科技的手段升级监管能力。
区块链技术与大数据结合
将有巨大潜力和前景
如前所述,怎样能既把数据有效地利用,形成数据的价值,同时又有效保护每位消费者、用户的隐私,是当前各大企业和政府面临的问题。“315”当天举行的“2018新技术与消费者保护峰会”上,中国人民大学启动了大数据区块链与监管科技实验室,我们认为通过区块链技术能够更好地解决这个痛点,既对消费者数据加密,又能够和其他的数据持有方进行数据的共享,通过区块链技术和哈希值把相关信息共享之后,同时又保留原有的数据,进行交流和交换,确保每一位数据的组成、交易还是保留在原有的企业或者个人内部,确保数据的安全和交易能够共同实现。
区块链的设计是透明的,可以让金融机构直接、即时、完全透明地向监管者提供信息。因为几乎任何类型的信息都可以数字化,并将其编码后放入区块链中,这个数据库在原则上是可以防篡改的、永久的,并且其有效性已被共识机制所佐证。区块链技术与大数据结合未来将有巨大的潜力和前景。
此外,数据权属如何配置的问题,即如何合理划分提供基础数据的用户与加工处理数据的企业之间的利益,以及数据在不同司法管辖权内流转涉及的跨境安全等问题,皆是值得我们进一步思考与探索的方向。
(作者系中国人民大学金融科技与互联网安全研究中心主任)