认知丨大数据的“多维度”与“时效性”
在吴军的新书《智能时代》里专门讲了大数据的特点和应用领域。本文将以普及为目的,向您推介大数据行业的基本常识。
首先,大数据比传统数据牛的地方,不光是体量大,还有两个重要特征:多维度和时效性。
先说多维度是什么意思。百度曾经发布了一个统计结果,叫《中国十大“吃货”省市排行榜》。榜单上的一些内容非常有趣,像北京网友最经常问的问题是“某某的皮能不能吃”;内蒙古网友最关心“蘑菇能吃吗”,宁夏网友最关心的竟然是“螃蟹能吃吗”。这个榜单的数据是怎么来的呢?百度没做民意调查和饮食习惯的研究,而是从“百度知道”的7700万条和吃有关的问题里“挖掘”出来的。
为什么说这件事就反映了大数据的多维度呢?因为“百度知道”的数据维度很多,不光涉及食物的做法、吃法、成分、价格,还能收集一些隐含信息。比如提问者或回答者的个人信息,用的是手机还是电脑,用什么浏览器。这样,百度就可以得到不同年龄、性别和文化背景的人的饮食习惯。如果再结合每个人使用的手机或电脑的品牌和型号,分析他们的收入,百度甚至能分析出不同收入阶层的人的饮食习惯。也就是说,这些隐形维度对于饮食习惯虽然没有直接影响,但是如果把原来看上去没关系的维度联系起来,经过挖掘、加工和整理,就能得出有意义的统计规律。
接下来我们看看大数据的时效性,它帮助我们做到了很多过去做不到的事情,比如城市的智能交通管理。以前没有智能手机和智能汽车,很多大城市虽然有交管中心,但它们收集的路况信息最快也要滞后20分钟。用户看到的,可能已经是半小时前的路况了,那这样的信息就没啥价值。但是,能定位的智能手机普及以后可就不一样了。大部分用户开放了实时位置信息,做地图服务的公司,就能实时得到人员流动信息,并且根据流动速度和所在位置,区分步行的人群和汽车,然后提供实时的交通路况信息,给用户带来便利。这就是大数据的时效性带来的好处。
光有大数据还不够,还得学会利用大数据。接下来给你讲个故事,看看美国警察是怎么用大数据思维,来打击毒品犯罪的。
毒品一直是美国社会的毒瘤。过去,美国警方缉毒的重点是切断南美洲的毒品供应。但后来他们发现,这样不行,因为有些能提炼毒品的植物,比如大麻,可以在家里种。有人就买下豪宅,外边的花园里种上鲜花,里边装上LED灯,种盆栽大麻。每年卖大麻的钱除了给豪宅分期付款,攒起来还够给第二座豪宅付首付。警察即使怀疑也不能轻易进去搜查。但是到了大数据时代,通过分析智能电表收集的用电量,就能抓住很多在家里种大麻的人。
为什么说这是大数据思维解决的问题呢?因为以前的老式电表只能记录每家每月的用电量,而智能电表可以记录用电模式。种大麻的房子用电模式跟普通住户不一样,只要把每家每户的用电模式,跟典型的居家用电模式进行比对,就能圈定一些犯罪嫌疑人。
这个案例体现了用 大数据 思维解决社会问题的亮点:首先用统计规律和个案对比,做到精准定位。然后在取证时利用相关性代替直接证据。最后,执法成本大幅下降。这都是大数据带给社会的便利。
在商业领域大数据也有更广泛的应用。比如一家连锁百货通过分析顾客购买的商品,判断顾客的身份和购物偏好,有针对性地推送促销信息,营业额取得了快速增长。
大数据处理信息服务商金盛网聚WJFabric认为,大数据能带给商家更多的机会,给社会提供更多便利。在未来的商业社会里,谁能占有更多更有价值的数据,谁就能在竞争激烈的环境里快人一步。通过分析所掌握的数据,了解数据提供者的信息并加以总结,以此创造更多为之提供服务的机会,进而创新大数据时代的商业生态。
责任编辑:王培