社交网站的使用记录能够预测各种个人信息 | 互联网的那点事

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

摘要: 在互联网时代,隐私泄露已经成为一个非常普遍的问题。近期的一项研究表明,即使你没有把个人信息直接放到网上,只要提供了你的社交网络使用记录,统计模型就能把你的各种信息相对准确地推算出来。来自剑桥大学的kosinski等人通过facebook上的应用收集了58000...

在互联网时代,隐私泄露已经成为一个非常普遍的问题。近期的一项研究表明,即使你没有把个人信息直接放到网上,只要提供了你的社交网络使用记录,统计模型就能把你的各种信息相对准确地推算出来。来自剑桥大学的kosinski等人通过facebook上的应用收集了58000人的数据,包括他们的“like”记录、人口学信息,以及各种心理测验的分数。接下来,研究者建立了统计学模型,使用“like”记录来预测后两者。

结果显示,“like”信息能够以95%的准确率预测种族(黑人还是白人),预测性别的准确率有93%,预测性取向的准确率为88%。此外,预测单身状况的准确率是67%,预测饮酒、吸烟和药物使用的准确率也可达65%-73%。就连预测21岁时父母是否已经分居,准确率也有60%。
对于性格、智力等心理属性,模型也表现出了很强的预测力。对于开放性这样的性格特质,预测准确性甚至与人格量表的信度处在同一水平。
研究者还给出了对于各项信息预测力最强的“like”条目,其中有许多有趣的趋势。比如,智力高的用户更喜欢《教父》、莫扎特和囧司徒的daily show;内向的人更喜欢游戏和动漫;是否喜欢科学既可以预测较高的智力,也可以预测较低的生活满意度。
研究者认为,这种技术既有好的方面,也有不好的方面。准确地预测个人属性和偏好,可以帮助改进在线广告等服务;但是,这也让个人保护自己的隐私信息变得更加困难。
这项研究即将发表在proceedings of the national academy of sciences上。

&

更多

  • 随意打赏

    提交建议
    微信扫一扫,分享给好友吧。