达则兼妓天下,穷则独占妻身——论大数据教的起源
雷锋网按:本文作者北冥乘海生,来自公号计算广告(ID:Comp_Ad)。
简单来说,以开源框架为基础大规模地处理用户行为数据,并服务于自动化的决策过程,是大数据在宗教化之前基本的外延。
一门宗教的兴起,少不了两个必要的条件:首先要有大多数人的认识层次不能解释的的自然或社会现象;其次是某些特定的人或阶级能够从中获得权力或者利益。而大数据完美地满足了这两个条件。
本文的标题语,来自我的高中同学,现就职于阿里集团,擅长跳探戈的某非著名仁波切,在这里对他表示言不由衷的感谢。
与广告技术公司有关的讨论到上一篇告一段落了。作为严肃的学术性自媒体,我们从今天开始进入一个更加圣洁的领域——大数据(big data)。请诸位读者找一个面朝大海、春暖花开的小木屋(把你的手机壁纸换成这样一副图也可以),慢慢地闭上眼晴,从心灵深处荡漾起一串串的0和1,随着本文的展开,进入令人激动和颤抖的大数据之国,用虔诚的祈祷让它去解决你生命中的一切悲哀与彷徨吧!
为什么这段话饱含泪水?因为我对大数据爱得深沉。在当今的中国,你不能把大数据仅仅看成是一项技术,它已经成为互联网时代的一种新宗教。现在,IT相关或不相关从业者们最关心的三个终极哲学问题就是:我从哪里来?我要到哪里去?我为什么会出现在大数据群里(见下图)?当然,笔者并非此宗教的神职人员,因此更多的是从旁观者的角度,来探讨大数据宗教的源流与发展。
首先,要解释一下“big data”这个词本身。 大多数读者可能并不知道,其中的“big”这个词,实际上是音译自汉语的借词,而原文诸位都不陌生,就是“逼格”。 为什么要在“data”前面加上这样的定语呢?大数据在宗教化之前有什么实际功用么?大数据相关的社会阶级现状与诉求又如何呢?别着急,听我慢慢道来。
我们先来看看历史上狭义的大数据是什么样的 。
在互联网纪元之前,主要的数据处理是针对交易数据。什么是交易数据呢?也就是业务运营过程中不得不记录的数据,例如银行的转帐、存款、利息,运营商的充值、流量减免等。由于一致性要求高、时延控制严格、价值密度高,交易数据的加工和处理并不简单,而传统的IT厂商,特别是IOE,在这方面积累了大量的产品和经验。而互联网诞生以后,以用户上网行为为代表的行为数据,也被无心插柳地记录下来了。这些行为数据的体量巨大,但是在一开始并没有得到真正的重视。不过,随着个性化推荐、计算广告、个人征信等业务优化和变现应用的开展,大家发现,这些行为数据里也蕴含着巨大的总量价值。不过,由于价值密度低、一致性要求不高,行为数据的加工处理,往往并不适用IOE的方案,而是为成本大大降低、吞吐量大大提高的开源框架所替代,并且其输出的结果一般是服务于自动的机器,而非领导与人工决策者。 简单来说,以开源框架为基础大规模地处理用户行为数据,并服务于自动化的决策过程,是大数据在宗教化之前基本的外延。
然而,当主流媒体和专家讨论大数据时,你看到的却往往是这样的语录:
大数据科学家=统计学家+程序员+讲故事的人+艺术家
“体会、体验、直觉、灵机一动、内省”这些看似与大数据无关的东西有可能恰恰就是大数据的核心
全球数据量每18个月翻番,到2015年,中国专用大数据人才预计缺口将达到1400万
大数据将改变{你的生活|全球贸易|传统教育|石油开采|…...}
如果将这些语录收集在一起,一本新的经书就诞生了。与《圣经》或《古兰经》一样,它涉及到你生活的方方面面,从灵魂深处对你中午吃面应该打什么卤、出门应该先迈哪只脚、以及是否应该带着尿布喝啤酒等问题,给予哲学上和方法论的指导。这就是让每一个互联网人疯狂的大数据教。大数据教的影响已经渗透到了我们身边的每一个细节之中:去年,一位快板表演艺术家曾经找到我,跟我探讨是不是能把他们这种艺术形式改名为“大数来宝";前两天,我几岁的儿子困惑与我与别人通话时经常提到的“大数据”一词,满脸狐疑地问我:“爸爸,你为什么要把大树锯了啊?”
大数据能够在中国的土壤上开枝散叶,取代阴阳五行成为解释和指导世间万物的第一法则,并不是偶然的,这与中国人的宗教观大有关系。中东闪含民族对待宗教,不但自己虔诚,也要别人虔诚,于是飘洋过海四处传教,甚至用战争获得信众;南亚印度民族对待宗教,自己非常虔诚,但并不强求别人虔诚,有时还会主动向人介绍别的宗教以维护百花齐放的市场格局;
而东亚汉字圈民族对待宗教,自己并不虔诚,却要求别人假装虔诚。这是为什么呢?因为渡一个有一个的提成。笔者有位朋友的远方亲戚,在西北三次皈依天主教,因为每皈依一次可以领一袋面。
听说远在地中海之滨不明真相的教皇老人家,看着中国教徒数量的增长沾沾自喜,我有点莫名的悲哀:难道他连积分墙的留存差都不懂么?
既然宗教已经由目的变成了手段,那么信什么,怎么信,就不再是一成不变的,而且可以与时俱进,不断发展和演变的。这样的宗教观在越南人的高台教那里达到了顶峰,看看他们的诸神列表就明白了:高台仙翁大菩萨摩柯萨、释迦牟尼、耶稣、老子、孔子、观世音、李白、关公、姜太公、牛顿、维克多·雨果、莎士比亚、丘吉尔、克里孟梭、孙中山。您还打算信什么?都给您预备齐了!那么大数据这样一个让万民兴奋的概念,自然不会被中国的宗教缔造者们放过。
一门宗教的兴起,少不了两个必要的条件:首先要有大多数人的认识层次不能解释的的自然或社会现象;其次是某些特定的人或阶级能够从中获得权力或者利益。而大数据完美地满足了这两个条件。
先说第一个条件。在中国传统的商业运营中,数据的作用是被严重忽视了的。大量以个人崇拜和价值观为核心竞争力的中小企业,从来没有想到过用数据来辅助老板们的神谕。因此,当他们听说大洋彼岸的互联网众巨头们居然在数据神的帮助下,建立起一套躺着挣钱的商业体系,顿时感到无比错愕。 于是,他们在生命中第一次拿起了计算器,打开了excel,面对着跳动的小数点激动地流下泪来。“I got it! I got it! Big data! My god!” 而大数据,也就理所当然地成为他们心目中心的神祗,和自己后半生财富无可替代的守护者。至于Hadoop、Spark这些神物,就如同新宗教里的云、罗、伞、盖、花、罐、鱼、肠,无需窥视其中天机,只要虔心礼赞与宣传。
再来看第二个条件。大数据这样一个宗教化概念,能够为其教士群体带来什么样的利益呢? 在中国,一个概念要想成功宗教化,成为政府、企业、资本和不明真相的群众共同膜拜的对象,关键要看其是否能“落地”。这里的落地,指的是落实到房地产行业。 对下层信众而言,管你是基督教、天主教还是印度教,谁能分给我一袋面,我就信谁!对上层教士而言,管你是 物联网 、电子商务还是云计算、大数据,谁能让我找个由头拿地,我就传谁的教!你看看这些概念,电子商务,可以建仓储基地;云计算,可以建计算中心;而大数据,可以建数据中心。管他是仓储基地还是数据中心,总免不了有些配套的写字楼乃至住宅,这才是整个体系关键的杵门子。
于是,在万民顶礼大数据的时代狂欢中,上层集团通过对教义(白皮书)、教会(行业联盟)、仁波切(大数据专家)的组织与控制,可以获得土地与财富,尽情地享受供养与双修的特权,即使是正当地与多名异性保持不正当关系,明确地达到巨额财产来源不明这样的理想,也未必仅仅是理想,正所谓 “达则兼妓天下” ;而中层教士们通过宣教大数据乌托邦,为各品种的猪插上数据的双翼,顺利地飞上风口,自己也可以在大数据时代继续中产与社会中坚的地位,正所谓 “穷则独占妻身” 。而广大底层码畜与群众,请打开你的味蕾,尽情地跪舔大数据美妙的滋味,无私地供养大数据仁波切们吧!
令人遗憾的是,在这样的时代里,还有部分企业和伪专家,置改造世界的伟业于不顾,拘泥于站在阴暗面上报Hadoop和Spark的Bug、指摘个性化推荐算法的局限性,深深地陷入工具主义和实用主义的泥潭。这样狭隘的视野与思维,恐怕迟早为行业洪流所淘汰。
大数据教兴起的时间虽然不长,却诞生了错综复杂的诸多流派。除了共同信仰大数据神,他们在教义和戒律方面几乎互无关联,特别需要一次系统的论战与总结。 大数据教的主要流派包括:数据中心派、Excel派、解决方案派、开源工具派、形而上学派、精品购物指南派等等。那么这些派别都有哪些宗教主张呢?且听下回分解。
雷锋网 (搜索“雷锋网”公众号关注) 注:转载请联系授权,并保留出处和作者,不得修改文章。