大数据也是个江湖: 关于腾讯大数据「购买iPhone人群普遍无房无车学历低」的一地鸡毛-36大数据
作者:傅一平
腾讯大数据3月9号发布了一个大数据报告《从HUAWEI Mate 9看国产高端手机市场》,最近几天突然有媒体解读这份报告,提到:“近期腾讯一份报告显示,用苹果手机主要是屌丝。根据腾讯大数据的分析,在Mate 9、iPhone 7、三星S7这三款手机的使用人群中,华为以男性/高学历/中青年/高管为主;苹果以女性/中学历/青少年/职场新人为主。购买iPhone 7的人群普遍无房无车学历低!”
有报告为证:
然后出现反驳帖《用iPhone7的普遍无房、无车、学历低?腾讯大数据惨遭移动打脸》的文章。
“随之而后,更是引来XX运营商的直接打脸,移动数据表明,iPhone在企业中高层中据绝对优势地位,但iPhone7的使用率逊于iPhone6。iPhone6用户今年可能将迎来大规模换机潮。
移动的相关数据表明,iPhone 7用户大约是华为MATE9用户的7倍,78.2%中高层使用iPhone 7,18.3%使用华为MATE 9。但MATE9用户中的年龄确实更大,平均年龄比iPhone7用户大7岁。”
各大网站纷纷转载,在乱花渐欲迷人眼的各类评论中,到底真相是什么?由此延伸开来,面对网上到处充斥着各类的大数据报告和统计数据,我们未来到底应该信谁?
首先不要去做键盘侠,不要一上来就凭着主观认识站好队,比如一看到华为和苹果就自然想到国产和国外品牌之争,由此延伸到爱国,由此关联到自己身边的人和事来证明自己的看法,人类简史说的好啊,大脑有一个本事就是善于联想,善于编故事,其在促成人类进程中发挥了至关重要的作用,但是,我们不能被自己的直觉大脑蒙蔽。
凡事理性的去做分析,用逻辑去判别事情的真伪,不要人云亦云,是作为一个理性的人,一个数据人应该具备的基本素质。
这里就以这份报告为例,谈谈我的理解。
首先不要轻信别人转载的东西,别人家的东西要努力去核实,笔者查了下,发现腾讯这篇报告竟然早在3月份就发布了,发布的地方是腾讯大数据微信公众号,名字叫《从HUAWEI Mate 9看国产高端手机市场》,其实一看名字就知道这是一篇很“正面”的HUAWEI Mate 9的文章,当然,不能不看内容就说是激励文章。
其实这篇文章内容根本没有其他媒体转载的那样用词激进,一比对就出现大量不符合,媒体说“近期腾讯一份报告显示…”,其实不是近期,明明是3月份,数据还是12月第四季度的,都过了大半年了,手机市场风云变幻,即使腾讯报告原来说的对的,现在9月份也缺乏了依据,数据分析中时间是核心的一个维度,个别媒体这么爬灰,不得不让人怀疑用心了,这是第一个纰漏。
其次,个别媒体用了较激进的词做出总结:“购买iPhone 7的人群普遍无房无车学历低”,在腾讯的报告中,其实也没有这么提及,关于无房的判断也是个笑话,明明从图中看到Mate 9和IPHONE 7有房的比例是差不多的,只是另一个指标想买房一族IPHONE 7比例高一些,怎么曲解成了无房人士的特征?那Mate 9买房意愿低是否可曲解为没买房能力啊?其实这个指标好理解,IPHONE7的年轻人多一点,因此肯定想买房的多,但这个群体有房的比例也不低。
但在腾讯报告中,很多没有具体数据的说明,比如很多图标坐标都没有,大家都知道统计和图表的艺术,有本书叫作《统计陷阱》可以看下,设想比例差0.1个点,图表也能通过鬼斧天工的艺术画出差距很大的效果,这样分析师想要表达什么样的观点,就可以表达什么样的观点,这不符合客观精神,也会给人以误导。
三款手机都是高端品牌,其实这些图表只能反映相对的事情,而不能下绝对的判断,比如“购买iPhone 7的人群普遍无房无车学历低”,在说这句话前,必须加上定语与华为Mate9的人群相比,而不是单独拉出来吸引眼球,一些媒体习惯了这样说,但看的人要长个心眼。
大数据报告更客观的做法,应该是列出所有图表的TGI数字,同时标明统计数据的口径和来源,其实可质疑的东西很多,比如怎么判断职场新人?调研来的?样本多少?是全国还是部分区域的?哪个时间段的数据?家里有住房怎么判断的?想买房怎么判断的?如果是手工调研得到的,也不能算是大数据了。
其实如果没有这些数据来源和口径的说明,任何人都可以对其数据的真伪性进行质疑,这份报告也不要当真,更不值得评论。
接下来再说说反驳的那篇文章有没有理,其实有些比较跟腾讯不在一个点上,比如反驳的报告提到78.2%中高层使用iPhone 7,18.3%使用华为MATE 9,但腾讯大数据报告中是使用MATE9的所有用户中中高层的比例,两者不是一个指标,不具备可比性。
前者的计算公式是:中高层的用户中使用MATE 9的用户/中高层的用户
后者的计算公式是:MATE 9用户中的中高层用户/MATE 9用户
真是一地鸡毛,其实想想也明白,由于IPhone7基础大,因此IPhone7中中高层的比例当然会偏低一点,腾讯大数据报告提的也没错。
结论就是:在中高层用户中IPhone 7的比例比MATE9更高,MATE 9中中高层的比例比IPhone 7的高,谁都没毛病,谁都有前途。
大家这回知道统计的艺术了吧,要说你好,你就好,要说你不好,也总有其他的角度,全赖口径,但有多少大众能看到这里面的微妙关系呢?也许事物本来就是这样,有了江湖就会有利益,有利益就会有纷争,大数据也是个江湖啊,因此我们必须有自己的判断,否则就被愚弄了。
最后说下,运营商拥有的大数据的确可以较为准确的统计到这些终端数据,而且口径可以透明化,下面简要做个描述。
- 年龄数据:从运营商的用户实名资料中,可以方便的得到用户真实年龄,毕竟有身份证信息,这是非常核心的用户注册资料
- 终端数据:用户每次通话或上网根据通信协议终端都会自动上发串号信息到基站,因此运营基于计费话单可以识别到每个用户的终端串号,并且跟手机号码是一一对应的,其终端数据应是业界最实时和真实的,质量非常高,笔者以前有一篇文章《终端企业需要什么样的终端分析报告》专门做过介绍
- 中高层职业数据:运营商可以通过维系的集团客户信息中的重要和关键人员属性信息进行判断,也可以通过运营商通信交往圈的pagerank分析挖掘到一个企业的核心人物,其它诸如集团彩云等通信录信息也能提供一些辅助。
希望玩大数据的都有这个勇气。
进入 傅一平 先生在36大数据的专栏>>>
End.
转载请注明来自36大数据(36dsj.com): 36大数据 » 大数据也是个江湖: 关于腾讯大数据「购买iPhone人群普遍无房无车学历低」的一地鸡毛