广告主,小心微信第三方监测平台的鬼话!
导读 : 随着微信公众平台的崛起和在网红以及草根营销者当中炙手可热的发展,伴随着微信公众平台衍生出的第三方数据监测平台也应运而生。
文/吴伟(微信ID:wuwei88-00)
曾几何时,大数据这个词闯入了互联网人群的眼中,并迅速成为了高逼格人群交谈必备词汇。但慢慢大多数人认识到大数据的真实反馈之后,就不再对其神秘保持新鲜和艳羡,甚至接地气务实的从业者从来不拽词装高端。
本人今天要说到的是微信大数据分析,随着微信公众平台的崛起和在网红以及草根营销者当中炙手可热的发展,伴随着微信公众平台衍生出的第三方数据监测平台也应运而生。由于微信向来是比较封闭的,重视圈子的概念,不像微博的媒体广泛传播属性那么强,所以一开始接触微信的人大多不了解其中的门道,这也就促成了第三方数据监测平台的可依赖性。
因为大家都不懂嘛,你的数据只要大部分还算合理,不合理的地方有合理的解释,那么大家都会买账,口耳相传。
在此列举三个比较早期,在行业内排名靠前的数据监测平台:新媒体排行榜、新媒体指数、微指数。最早出现的是新媒体排行榜(以下简称新榜),也是最早在公众号榜单和文章榜单上确定地位的,那个时候还没有搜狗的微信搜索,而诞生的公众号数量也还比较少,那是一个你想要关注一个高质量账号却不知道如何去寻找的年代,不像现在,关注过度饱和,内容过度充斥。
新榜监测的公众号数据仅仅十几万(现在样本数已超过20万),但是公众号的数量现在已在两千万左右(具体多少我也不清楚,请勿抬杠),样本数量其实是蛮低的,但由于新榜出现较早,且自身监测算法也已更新数次,数据慢慢趋向于真实准确数值。
数据分析自然需要数字来衡量和比较,为此新榜发布了一个自家的指数——新榜指数(New Rank Index,NRI),该指数是由新媒体排行榜(newrank.cn)基于海量数据、用户深度反馈及专家建议而推出,用于衡量中国移动互联网渠道新媒体(主要指两微一端)的传播能力,此指数反映该新媒体主体的热度和发展趋势。
新榜指数是由原始数据参照基数通过计算公式推导出来的标量数值,用以衡量原始数据在其所属维度的相对表现。在此需要指出,新榜指数是为所有账号提供了一个参照系,如果想要不同账号之间进行比较,那就需要一个严格的前提——参照系稳定。
只有参照系稳定,比较才是有意义的。而这个参照系的稳定来源于长期的对于参照系内所有账号进行观察和考量,但是样本数量20万的参照系是否具有参照性呢?答案并不是肯定的,那么如何解决这一问题?参考微信官方的数据参照系,微信官方的数据统计是基于平台所有账号(无效账号除外)的数据分析,这个数据自然是最具有参照标准的,比如公众号的阅读转化率平均在8%-10%,劣质账号低于此区间,超优质账号高于此区间。
这个区间值比较重要,后面说到的相关内容还会用到。
不管你们能不能看得懂,在此先展示一下新榜指数NRI3.0版本吧,以下数据算法解释来自于新榜:
1、选定指标
在微信的计算中,为兼顾其数量与质量,我们使用总阅读数、最高阅读数、平均阅读数、头条阅读数、总点赞数五个指标来对账号进行评估,其中:
整体指标(总阅读数,R):指统计周期内所有发布内容的阅读数总和;
优异指标(最高阅读,Rm):是指统计周期内所有发布内容中的单篇最高阅读数;
质量指标(平均阅读数,Ra ):统计周期内所有发布内容的阅读数平均值;
主动预判指标(头条阅读,Rh ):统计周期内位置为头条的内容的阅读总数;
互动指标(总点赞数,Z):统计周期内所有发布内容的点赞数总和。
2、指标标准化
基于不同维度指标的差异性,我们首先将所得数据标准化,即通过对各维度原始数据与该维度常数的比值计算,得到该样本各项指标的千分化数值。
在新榜指数中,以天为最小计算周期,将常规(1天推送一次,每次最多8篇)的公众号为对象在这一时间段内总阅读数、最高阅读数、平均阅读数、头条阅读数和点赞数共五个指标的常数分别记为:
在不同的时间周期,即日、周、月、年(n=1,7,30,365)下,以上常数具体数值为:
在此基础上,各指标按以下公式进行标准化:
注:此处“+1”是为了避免出现类似“ 0 阅读”时而产生无效值。
指标加权
由于此五项数据影响微信传播能力的程度不同,我们赋予不同的权重,分别记为 ωR , ωRm , ωRa , ωRh , ωZ 。
最终,新榜指数的计算公式表述为:
目前,新榜使用的系数为 ωR =0.75, ωRm =0.05, ωRa =0.1, ωRh =0.05, ωZ =0.05。
而另外一家,新媒体指数也出台了一套自己的指数标准,叫WCI,中文名字:微信传播指数;英文:wechat communication index。给出的解释是由微信原始数据通过一系列复杂严谨计算公式推导出来的标量数值,至于新媒体指数的样本数量嘛,本人没有深入考究,这都不重要,重要的在后面。
那么这个WCI又有什么用呢?WCI指数可以全面反映出微信公众号推送文章的传播度、覆盖度及公号的成熟度和影响力,从而反映出微信整体热度和公众号的发展走势。
而WCI指数又是怎么算出来的呢?WCI用最高阅读数、日均阅读数、篇均阅读数、日均点赞数、篇均点赞数和最高点赞数六个指标对微信账号进行评估。
同样的,考虑到各指标在反映传播能力方面存在差异,新媒体指数也赋予了6个指标不同的权重,最终的计算公式如下:
相对具有行业代表性的,第三家公司微指数,算是起步比较晚的,但是号称可同时监控1000万公众号,请注意这里的说法是可以同时监控,并没有说每天会去更新1000万公众号的数据,稍微懂点技术的人都知道,一个创业公司如果运行这么大数据的话服务器成本得有多高,样本数量请自行猜测,这里不便透露。
而微指数对于账号质量的监控指标是:7天平均阅读、7天平均点赞、每天发布条数、有效累计粉丝、有效日活粉丝。除了最后两个因素,其他都是毫无技术含量即可获取到的数据指标,跟前面介绍的两家其实并无不同,只不过新榜和新媒体指数在这些人人肉眼能够看到的数字上加入了人为干预系数,使之更加趋向于真实数值。
微指数呢,则是提出有效累计粉丝的概念来有理有据的告诉消费者我说的是对的,你不需要怀疑。为什么呢?因为我这个概念不是说账号真实的粉丝数啊,而是有效累计粉丝。
这个概念值是怎么来的呢?是这样的,前面我提到过一个公众号的阅读转化率平均在8%-10%区间,那好,阅读数不是都能看得到吗,而且我还可以做出平均值来,甚至我可以说我去除了刷量带来的虚假阅读,有效累计粉丝的值就是根据阅读数倒推来的。
你不信吗?如果你真实的粉丝比我展示的数字高,那么我可以告诉你高出来的那些是僵尸粉,你无法反驳,而我根据微信官方平均转化区间倒推出来的数字绝对不会有错,当然其中也加了一些权重,跟新榜、新媒体指数的权重添加类似。
同样概念,新榜也在去年末的时候推出,但是面临的同样的问题是预估粉丝跟账号真实粉丝差距太大,差距的缩小只好拿加权重来平衡和消除。
看到这里,不管你对前面列举的公式懂没懂,相信对于所谓的微信大数据概念有了些许的认知了吧,微信公众号远没有你们想象的那么封闭和神秘,很多数据都是可以通过第三方手段进行抓取,并且整合分析,进而得出相应的合乎常理的解释或者榜单数据来。
自从阅读数出现之后,微信的很多数据就出现在了人们的眼中,当然随之而来的另一个弊端就是刷量平台应运而生,很多账号存在阅读量造假的问题,但是阅读量造假这事儿目前来说还没有平台监测可以做到,因为服务器成本太高,且并无多大意义,本身互联网的水就很深,所有内幕大白于天下终归是不好的。
所有第三方平台说可以监测到任何账号阅读量造假的说法都是吹牛逼,因为目前第三方监测平台判定一篇文章阅读量是否真实的依据依然是对比近期平均阅读的浮动,而这是可以通过刷不同文章的阅读进行模拟真实阅读的。
微信公众号后台现在也出了文章阅读的来源来规避刷阅读量的现象,但是就在公众号后台升级显示阅读来源的第二天,某刷量平台就出现了应对措施,可以刷来源于不同渠道的阅读数,真是道高一尺魔高一丈。
对于第三方平台,通过获取微信公众号的部分数据分析整合号称大数据实属过分吹嘘,就连搜狗作为微信的合作伙伴都拿不到所有的微信接口,而你第三方平台仅仅是抓取了用户眼见的数据指标就敢号称微信大数据?我看你们所谓的大数据不过是大概的数据吧~
另外,透露一下,真正能够监测到阅读量造假的技术是将监测阅读数的时间无限细分,时间段无限取中位数,最后描绘出较长时间周期内的阅读走势。而这样以来会大大增加服务器的成本,刷阅读量的服务器成本是远远低于监测成本的,所以有水分的互联网还是不要太过吹毛求疵的好,睁一只眼闭一只眼,你高兴我也自在。
总体来说呢,说到微信大数据分析,不过是可见数据的统计学展示,至于粉丝用户人群画像以及行为习惯等因素,已现有的监测手段和接口开放程度来说是根本不可能的,如果有哪一方宣称可以制作人群画像,那也不过是基于手机型号大概推测用户购买力,用户地区分布进行区域划分,男女性别比例进行行业领域对应等等,而相对较聪明的做法是将公众号对应的微博账号粉丝进行人群画像分析,同样的结合部分可见数据加权处理,模拟出大概的人群画像,如果不准确,那就多加几个维度往最准确的人群画像进行靠拢。
而用户,尤其是广告主,需要知道也无非就是账号的有效累计粉丝,日活跃粉丝以及平均阅读数或者头条平均阅读数,至于更垂直更严苛的要求对于广告投放来说还不是太需要,相比之前公关公司只给到粉丝数和广告报价来说,现有的第三方监测已经做得稍微好一点了,但是别以为做到这样就是准确的大数据,还仅仅是大概数据而已,谨以此文告诫公关公司和广告主们,不要对第三方公司的所谓大数据过分信赖,那也只不过是服务器帮助人做了计数平均取值的活儿而已。
而这种数据服务加到具体的自媒体大号报价里面那可就是你该掏钱的了,具体利润值多少在此就不便细说了,行业内不同公关公司报价是不一样的,基于创意策划的附加值服务加钱合情合理,但这种数据服务如果加价过高只能就有点太一劳永逸了。