如何做好数据分析让运营效率提高100倍?

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

导师:王武佳,拥有十年社交经验。原51.com副总裁。擅长利用数据分析使运营工作事半功倍。

大家好,今天晚上很高兴来到馒头商学院,跟大家分享一些做互联网产品的一些心得,特别是数据分析方面的心得体会、还有一些教训和经验。

1、第一个故事

我先跟大家分享两个故事。第一个故事是关于“中国股票研究中心”的故事。故事是这样的,1月2号的时候,有一个人叫Peter,Peter收到一封来自“中国股票研究中心”的邮件,向他表示这个月市场会上涨。结果市场果然上涨,前段时间股票不错,很多人不知道在座的大家有多少买过股票。然后Peter收到这封邮件的时候,他不是很在意,因为大家都知道所谓的元月效应这回事,即好几年来都是一月份的股价涨的多。到了2月1号的时候,他又收到另外一封邮件,向他表示市场即将下跌,这一次,那封信又给说中了!Peter现在终于开始相信这个研究中心真的是有点水平。3月1号的时候,Peter又收到一封信,情形还是一样的。

Peter觉得很神奇,他主动联系对方,希望下个月还能收到同样的邮件,过了一个月,4月1号邮件如期而至,但这时候这个研究中心表示,前几封邮件预测太准了,结果引起了证监会的高度重视,他们以后不能再像以前那样大规模的免费发送邮件了,只能对少数有见识的VIP客户提供投资建议,而你是非常幸运的一名,获得了有限的100个VIP购买资格。

你是怎么看待这个“中国股票研究中心”呢?

A、这个肯定是有内幕的,否则怎么可能预测得这么准呢?

B、世界上什么样的人物都有,估计真的是预测水平高吧。

C、不知道怎么回事,既然这么准,要不买个VIP资格试试吧!

连续几次收到这样的邮件,我觉得要是换作在座的任何一个人,估计都会很心动。真实的情况是这样的,这个所谓的“中国股票研究中心”,他向市场上的非特定对象群发了大概1000封的邮件,然后把这1000封里面分为2组,一组是说告诉他接下来股票会涨,另一组告诉他会跌,每次发送的时候,总有一半的人是收到预测是准的邮件,而另一半的人可能就收到预测是错误的邮件。接下来循环同样发送几次之后,可能每次连续几次总有几个人收到的邮件是始终预测正确的,而Peter就是那个始终预测正确中的一个用户。

这样的案例可能大家在其他地方也看到过。他告诉我们一个道理,即在数据分析中你有时候会看到一些数据很稳定地朝一个方向变化,并不一定代表着真相就是这样的。

2第二个故事

第二个故事,这个故事发生在二战时候。英国,当时盟军跟德军在英国上空进行了惨烈的空战。但是发现空战的结果是盟军受到很大的损失,所以盟军就希望在自己的战斗机上增加一些装甲保护,但是大家都知道飞机的装甲是不可能无限制的加的,因为装甲越多,飞机一定是飞得越慢,然后耗油量越大。于是,空军就请来一些专业的统计学家、数学家,一起来分析看看能从现有的飞机的数据上看看在那些部位增加装甲是最划算的。

这个故事的主人公沃德教授就跟空军一起来到了维修基地,大家做了一轮统计下来之后,发现所有盟军正在维修基地中维修的轰炸机的机翼上,弹孔是分布的最多。但是发动机舱跟驾驶员座舱的弹孔数是最少的。于是,空军就比较倾向于希望能够加强机翼部分的装甲。在这个时候统计学家就有了跟那个空军完全不一样的看法,沃德教授就建议,他觉得应该是加强飞行员座舱跟发动机舱的装甲,因为那里发现的弹孔最少。

如果是你,你是同意沃德教授的看法呢还是同意空军的看法?我给出的答案是说我同意统计学家的看法,因为这里涉及到我们数据分析中的一个“幸存者偏差”。大家可以看到,虽然我们统计下来是那个机翼上中弹是最多的,但是实际上大家不要忘了这里我们所选取的样本并不是所有参与战斗任务的所有的轰炸机,而只是在维修基地中这些能够幸存下来的飞机。实际上我们在战斗过程中大量损失的飞机并没有在这个维修基地中出现,可能在空中就爆炸了或者怎样。

统计学上把这个叫做“幸存者偏差”。因为我们在分析数据样本的时候,只关注那些幸存者的数据。所以这个故事也告诉我们一个道理,做数据分析中选择样本是非常重要的。你如果只看到幸存者的样本,导出来的数据跟结论就是有偏差的。

前面讲的这几个案例可能跟我们的互联网产品工作都相差比较远。但是,统计分析的道理不仅是在我们的产品设计中有用,实际上在我们工作生活的方方面面,我们只要带着数据分析的思维,很多情况下都是非常实用的。

3、如何判断竞争对手数据的真实性?

接下来继续讲一个跟我们产品分析工作比较相近的一个案例,是一个关于情报分析的一个案例。这个案例的对象是一个比较有名的视频网站。这个网站在财报中披露到他们网站当年的高清视频服务的收入1.2亿,月均活跃付费的用户超过70万人。我们怎么确定财报中的这些数据是真实的呢?大家在平时在工作中也会经常遇到各种各样的数据,听到各种各样的八卦数据,到底是不是真实的呢?比如说,大家经常会听到说那个什么什么APP,它的最近的活跃又有多少啦,注册用户又有多少,每天新增多少用户啦,或者什么什么产品的订单数最近又有多少啦,这些数据我们是可以通过一些其他的方法来校验这是不是真实的。

我们就讲这个现在要分析的这个视频网站的案例。我们经过对他的网站进行研究之后,发现他的会员频道,这个视频网站的包月会员频道上有一个栏目,叫做新增会员。连续24小时,每隔一到两分钟,我们就把这个网页刷新一下,并且截图,然后把所有出现的用户名录入这个表格。

大家可以看PPT上的这样一个样本,我们把这些东西都记下来,然后把这些东西整理成一个Excel表。这个案例是几年前的一个案例,当时是在公司内分享,大家可以看一下,其实道理都是类似的。我当时是12年的时候,3月29号,这个是当时在网络上一个报道取下来的一个东西,就是3月29号的时候,这个报道中的记者,做了一个连续24小时的监测,从当天早上的九点到第二天早上的九点,取了这么多数据之后,我们会发现,这些数据是非常完整的,也 就是说这些数据有极少量的有断点存在。比如说这次刷新的最后一名,刚好是下一次刷新的第一名,那就是连续的,没有断点的。

我们刷新了24小时发现,这种断点很少,所以说取得的这个数据的质量还是很高的,然后我们把数据串起来放到Excel里面做了一个分析。最后算下来,这个网站每月的包月的付费的人次不过是9000个人,跟这个公司在财报上披露的70万人其实相差是非常大的。讲这个案例的就是跟大家分析一下,其实大家平时听到的很多数据啊之类的,都可以用类似的分析方法来去分析。比如说你看一个App里面的说活跃数量啊之类的,有些App是有论坛的,你可以看看这个论坛里面的发帖数、回帖数,跟它官方公布的数据做一个比较,就可以发现很多问题。

4、数据的来源渠道

接下来我们讲到具体分析的一些方法,首先数据分析讲究一个数据的来源。主要有几大类的来源,一个就是用户行为的数据,主要有两类,一个在Web分析上我们把它叫做点击流数据,其实手机上也是类似的。我们以前在Web上的时候用百度统计,google统计很多,那在手机上大家都用友盟之类的。还有一个就是数据库。就是我们跟很多业内的朋友交流,也发现很多大家都在自己的公司里面做了很多这种BI系统来跟踪用户的一些数据。其他一些是定量或者定性的一些数据,比如说用户调研的一些数据,问卷啊,包括竞争对手的一些数据,有了这些数据之后,第二步我们就可以开始分析了。在分析之前,我觉得有一个非常重要的事情就是一定要弄清楚,我们分析这些数据的指标的含义是什么。

5、每个数据指标的含义一定要清晰

举个例子来说,我们发出了1000万的邮件,到达率是99.99%,打开率是19%,点击率是19%,那看过信的人都点击了,说明设计很棒,效果很好。从点击的情况来看,80%的客户都是新访客,说明我们这次活动对抓取新用户是非常成功的。唯一的缺陷是我们网站的抓住客户的能力,访客来到网站之后,平均的访问时长只有19秒钟。我们下一次应该进一步优化这个网站,总体来说我们的营销活动还是非常成功的,投入了只有20万,但是追踪到了200万的销售额,我们的ROI是1000%。

假如说你的同事给你发来了这样一封邮件,跟你说总结近期做的一个活动,得出这样一个结论,你看了之后会有怎样的感受。你的理解是不是类似这样的,发了1000万的邮件,到达率是99.99%,那到达率是99.99%,是不是意味着有999万的用户收到了邮件呢?打开率是19%,那是不是意味着190万的客户打开了邮件呢?那点击率也是19%,那也就是说有190万的用户点击了你的邮件,是不是这样呢?

所以这样很自然就推出一个结论说我们所有打开了邮件的客户都点击了邮件里面的链接,这是不是大家理解的东西呢?后面还说这190万中有80%都是新用户,我们达到的效果就是原来的190万的80%,即152万的人这些新用户对我们重新有了一个了解。停留时长是19秒,还有200万的销售,那毛利率是20%的话,利润有40万,我们才花了20万的成本却取得了40万的利润,那这个效果是太划算了。

这个理解究竟对不对呢?我们不能望文生义地区理解一些东西,我们得仔细辨别一下我们这些指标的含义。比如说这里面说的到达率是99.99%,这个到达率本身就有很多含义。一般来说,在邮件营销中,所谓的到达率是指对方邮件服务器没有拒收的这样一个信息。但是,没有拒收,不代表这个用户真正收到了你的邮件。因为有的时候,对方邮件服务器认为你是垃圾邮件,实际上并没有把这个东西投递到你要的收件人手上,但是他也没有给你返回错误,所以说你在这个数据上统计出来就会得到一个偏高的数据。一般来说,实际上真正的到达率是比我们数据上能看到的要低一些了。理解并且弄清楚这个到达率的定义是很重要的。

打开率是怎么定义的?从字面上理解说打开率就是有多少人打开了邮件,这个地方就要说到一个坑了。我们统计打开率的办法,技术上的原理是在我们邮件的正文页面中嵌入了一张一个像素并且透明的图片。在服务器上,我们统计这个图片被加载的次数。如果我们弄清楚他的原理我们就知道,图片的加载次数跟真正打开的数据并不会完全吻合。造成这个差距的原因可能是这个用户打开邮件的时候是用纯文本的方式,看不到我们html页面,或者说我们的图片服务器加载得比较慢,可能用户已经看完了邮件,但是这个一像素的图片还没加载完。或者其他原因。总体来说我们实际的打开率应该是会比我们统计到的打开率要高一些的。

了解这些指标定义之后,我们会发现这些东西跟我们想像的望文生义、简单理解的东西还是有点差别的。在数据分析中,用户的细分是很重要的,你如果没有细分,就是没有认知。你虽然投入只有20万,但是我们可以跟踪这20万里面有多少是新用户产生的,有多少是老用户产生的,这样就会更容易了解我们真实产生的利润是多少。

6、数据分析三步走

再来说说我们做数据分析一般的步骤会有哪几步。第一步,我们要了解这些指标的含义跟定义,以及统计的方法,然后我们要找到一个比较合适的指标来衡量我们做这种产品,做这个活动希望达成的目的跟效。

第二步就是研究这些数据,把无效的跟虚假的部分剥离,这个做运营或者做推广的同学可能会更加有感觉一些。包括我们投放广告,很多的假量啊之类的,这里面要好好去分析跟剥离的。

第三步就是通过测试或者一些辅助性的指标来计算和长期监控这些数据。通过数据来对产品进行改进,对活动的方案进行调整。

第一个就讲到说我要了解这个数字的一个含义定义,然后去理解我们真正所做的活动或者产品。讲这样的一个例子,还是说Peter,案例中Peter在新浪微博上看到菲利普空气炸锅这样的一个产品广告,点进去之后发现这个空气炸锅正在做特价促销,买东西全场免费,还送一堆赠品,他看到这个东西非常激动。于是就记下了这么一回事。过了两天,他在上班的时候,忽然想到自己要买个电饭煲,就找到了购物搜索的网站去比下价格,看完这个价格之后觉得不错,决定去买。但是买的时候很不巧,忘记带U盾了,所以也没买成。回家之后打开电脑,打开百度,一个个开始去搜索,搜索这个网站的名字跟电饭煲的名称,点开第一个链接,刚好就是你付费关键词的链接,把产品买下来了。

我们看这个案例会发现,用户购买的流程其实有好几步,在微博上看到,起到一个曝光的作用;第二步,进到比价网站上进到他的官网又详细了解,第二步可能是详细了解;第三步才是需要真正激发用户购买欲望,促使他下单的这种临门一脚的步骤。在产品传播的每一个阶段,这些渠道对我们产品都是有意义的,不管是微博还是比价网还是各种各样的百度搜索。我们发现用户在购买我们产品的时候,都围绕了这些渠道,但是我们在把每个渠道的数据拿出来单独去统计的时候,每个渠道效果好像都不是太好。

比如某个用户在微博上看了之后,当时并没有去买。因为当时可能还没下定购买决心,然后在购物搜索引擎去搜索各类产品的时候,打算下单,但是忘了带U盾,所以又没买成。类似这样的一些情况。当然这个案例本身有些极端。但是我们会发现最终用户下单是在百度上搜索了你网站的名称,然后进行购买。最终点击的是百度的那个SEM的付费搜素链接。

随意打赏

提交建议
微信扫一扫,分享给好友吧。