大数据:5种方法解读网站分析数据
数据是进行网站分析的基础,Google Analytics为一个网站提供了上百个报告和数据指标,它们分散在不同的维度中,如何来解读这些数据呢?单一的数据本身没有任何意义,只代表了它记录到的信息。(比如PV只代表页面被显示的次数)不同的处理方法也会获得不同的数据结果。(追踪代码在页面的位置会影响PV数据的记录结果)网站分析的工作就是通过对网站数据的解读,产生有意义的结果。(将数字转化为人类的语言)
跳出率是我们在网站分析中比较关注的一个数据指标,单一的跳出率数据有什么意义吗?
举个例子,网站的跳出率是50%,一个不好也不坏的数字。这个数据有什么意义吗?我觉得没有。因为它不能告诉我们任何信息。单纯的数据无法被解读。数据只是数据,不是人类的语言!
面对这样的数据,在进行网站分析时可以用5种方法来对数据进行解读。让数据变的更易读更有意义。并对下一步工作具有指导意义。下面用5种方法逐一来解读“网站的跳出率是50%”这个数据。
1 了解数据的意义和产生的原因
解读数据前先要清楚的了解数据背后所代表的意义及产生的原因(这个数据是如何被计算出来的。)
解读数据: 网站的跳出率是50%
跳出: 指单页访问或访问者的次数,即在一次访问中访问者进入网站后只访问了一个页面就离开的数量。
跳出率: 指某一范围内单页访问次数或访问者与总访问次数的百分比。
跳出率=跳出访次/所有访次
结论: 跳出率是一个负面指标,数据高不是个好事情。这个网站的跳出率有50%,说明有一半的访次在网站上只浏览了一个页面就离开网站了。
2 和历史数据做对比
前面知道了跳出率是个负面指标,但单一的50%我们不知道他对于网站来说究竟是算高还是算低,因为没有参照物。我们需要一个参照指标来对目前的数据进行衡量。这个参照指标可以是网站历史同期的指标。(对于有销售季节性的网站,历史同期数据很重要)也可以是行业基准指标。
对比前首先要确定这个数据产生的时间,然后选择有比较意义的历史数据,通过对比可以看出目前数据的好坏。
解读数据: 网站的跳出率是50%
确定数据产生的时间范围是2010年3月份。选择历史同期数据2009年3月份数据进行对比。(或者行业基准数据)
历书数据: 2009年3月份的跳出率是40%
行业数据:跳出率45%
结论:3 月份网站的跳出率是50%,这个数据高于去年同期数据,同时也高于行业基准数据。根据跳出率的定义,3月份网站对访客的表现变差了,有更多的访客只在网站浏览了一个页面就离开了网站。
3 把数据带入到趋势中
除了和历书数据相比,还要把数据带入到趋势中,因为数据不是孤立的,产生的原因多种多样。通过趋势中的背景信息可以获得更多的信息来解读数据。
解读数据: 网站的跳出率是50%
将3月份网站的跳出率是50%的数据带入到网站第一个季度的趋势中:1月份跳出率40%,2月份跳出率60%,3月份跳出率50%。通过对比发现在第一季度中网站的跳出率是一个先增后降的变化趋势。3月份的跳出率虽然比历书数据和行业数据要差,但其实是一个向正常的回归。而真正造成3月份跳出率高的原因其实发生在2月份。这时候就需要对2月的情况进行检查,比如:网站在2月份进行过改版,或者开展了某种营销活动。导致数据不稳定。
结论: 50%是在变化趋势中的一个数据,虽然比历史同期的表现要差,但是是向正常趋势的回归。所以不能仅凭50%的跳出率就说网站在3月份的表现变差了。
4 这是一个汇总数据吗?
通常网站的数据是对网站内不同频道,不同页面在不同时间内表现的一个汇总情况。在网站中,由于内容和功能的差异,所以各个频道或页面的数据表现都会不同。将网站总体数据分解到不同的内容中可以找到真正存在问题的部分。
解读数据: 网站的跳出率是50%
网站3月的跳出率是50%,是由3月每一天的跳出率汇总的。也可以是由网站的每个页面,每个频道数据汇总的。将数据细分到每个频道中会发现可能大部分频道的跳出率都低于50%,只有某个频道80%的跳出率拉高了整个网站的跳出率水平。
结论: 网站的整体数据是没有可操作性的,因为我们不知道问题真正出在哪里。通过细分可以找到真正出问题的地方,并且有针对性的进行优化,进而提高整个网站的表现。
5 这是一个平均数据吗?
网站的百分比数据通常都是一个平均数,比如跳出率,平均停留时间,平均页面浏览量等等。和汇总数据一样,这种数据没有可操作性,并且掩盖了网站中表现不好的部分。打破这些平均数可以发现真正有问题的部分。
解读数据: 网站的跳出率是50%
50%网站跳出率=网站中所有跳出访次/网站所获得的所有访次
可以按多种维度来打破网站的平均值
按流量来源:
百度跳出率=来自百度的跳出访次/百度带来的所有访次
按访客地区:
北京跳出率=来自北京的跳出访次/北京带来的所以访次
按访问时间:
第一周跳出率=第一周的跳出访次/第一周的所有访次
按频道内容: (需要有规范的URL规则支持)
新产品页跳出率=所有新产品页面跳出访次/网站获得的所有访次
按页面属性:
营销推广跳出率=推广页面的跳出访次/推广页面获得的所有访次
按访客属性:
新访客跳出率=新访客的跳出访次/新访客的所有访次
结论: 不同来源,不同地区,不同页面和不同的访次有不同的跳出率。通过细分可以打破网站的平均数陷阱。
最终结论:跳出率是一个负面的指标。网站50%的跳出率是在一个变化趋势中的数据,虽然高于历史和行业水平,但是在向正常水平的回归。通过对跳出率的细分可以发现,高跳出率是由于某个地区或某个流量来源的新访客在营销推广类页面上的表现造成的,这部分数据拉高了整站的跳出率水平,这类营销推广活动和新访客是造成网站在跳出率上表现差的原因。
解决的方法是
1优化营销活动页面。增加页面上的引导信息,降低跳出访次。
2分割流量进行对比。网站分割出营销推广的数据后,与历史数据再进行对比。
3细分现有流量。分割数据后对有问题的部分进行细分,对高跳出率的流量重点优化。
via:数据分析
End.