为什么在大数据时代,数据量最小化是一个重要组成部分?

数据观  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

大的就是好的,对吧?

但其实不是这样。甚至在 大数据 的领域里,公司和政府开始发现“物以稀为贵”。这和数据导向的CEO们的理念有着鲜明对比,比如亚马逊的Jeff Bezos,他说:“我们永远不会丢掉数据的。”

事实上,欧盟近期把这些新条款加入了《数据保护法》中,并在近期颁布。法条中指出,“用于处理或相关目的的个人数据需充足、相关、不冗余。”

为什么在大数据时代,数据量最小化是一个重要组成部分?

法条没有定义“充足、相关、不冗余”,但实际上,这意味着只收集并储存能够达到目的的最少量的个人信息。这种行为被称作“数据最小化”。

什么是数据量最小化?

数据量最小化指的是限制个人信息手机数量的行为。要求个人信息重要且与要完成的目标直接相关。

随着公司和企业对数据重要性的理解逐渐加深,数据变得无所不在,收集也就容易得多。但是在分析时,潜在分析点多得像“海啸”。

但随着物联网发展,企业面前摆着越来越多的收集各类数据的方法,特别是包括个人身份数据。

一些企业想着把数据存下来,供未来应用,但数据囤积的危险性并不亚于那些物理囤积:当真正需要使用时,堆叠成山的无用垃圾使我们很难找到我们需要的。要花费时间和金钱,还存在危险性。

除了“保存所有”的方法,智能数据管理员包含数据最小化政策,保证只保存相关并重要的信息。甚至Walmart做每日的营销策略时只依赖于前四周的数据。

数据量最小化的好处

我觉得公司应该只收集和储存他们需要的数据——把剩下的都删掉。数据掉价很快,为了“以防万一”把它们都存起来是危险的。

数据量最小化还能够节省开销。所有的数据储存都是有成本的,没有哪个商务活动的预算是无上限的——因此,没有哪家公司可以无限期地收集和储存数据。

另外,太多数据(尤其是个人身份数据)会带来大的风险。要考虑到数据丢失和破损。敏感个人信息的最大漏洞就是轻易破坏一家企业,甚至导致过失犯罪。想象一下,因为没有丢掉起初不需要的数据,结果造成了过失犯罪,会有多后悔。

随着《数据保护法》的实施,所有那些拿着欧盟公民相关数据的 企业 将需要对数据量做最小化标准操作处理以最大限度降低风险。但即使这是一项枯燥的新要求,对企业和个人都是一种保护。

为什么在大数据时代,数据量最小化是一个重要组成部分?

责任编辑:王培

随意打赏

大数据时代ppt互联网大数据时代大数据时代的机遇进入大数据时代重要组成部分大数据时代
提交建议
微信扫一扫,分享给好友吧。