5个步骤,教你找到数据分析的正确姿势
1 基本原则
做数据分析工作,一定要遵循一定的原则,这些原则,我简单列了列,属于亮哥比较看重的,但是不一定是通用的。
让我们先来看数据分析的流程。
亮哥认为,数据分析应该遵循下面这个流程:
也就是说,数据分析需要从问题中来回到问题中去。拆解一下其实,数据分析主要要有五个步骤:
问问题、找对象、选数据、做分析、再验证。
1. 问问题:数据分析必须要有明确目的
数据分析在启动时,一定要有非常明确的目的。
这种目的,可能伴随一次或多次目标明确的测试动作。
譬如说,原先的商品落地页的购买转化率比较低,需要使用新的落地页,以提升流量进入后的购买转化率。
这个时候问的问题,应该有3个:
- 当前的商品落地页是值得进行优化的吗?
- 商品落地页的优化是可行的吗?
- 能够优化到什么程度?
你会发现,这个时候,其实原先的一个目的(想办法提升商品落地页的购买转化率),就变成了3个问题,而这3个问题,接下来就要指导整个数据分析的过程。
2. 找对象:明确分析的可行性和分析的范围
对于上面的例子来说,其实是要对着三个问题来进行1by1的解决,需要去弄清楚对象。
- 当前的商品落地页是值得进行优化的吗?
这个问题的对象其实不是商品落地页,而是商品落地页的来源渠道的流量情况和流量到来后在商品落地页的行为模式。
因为,如果流量本身进入的就少,可能样本本身就不具备去测试验证的可能性,反而需要我们先去提升流量分发的能力。
- 商品落地页的优化是可行的吗?
这个问题的对象既可以是新的落地页,也可以是老的落地页,只要能够通过数据证明,对落地页的调整是否会影响购物转化率,那么就可以得到结论。
- 能够优化到什么程度?
这个问题其实现在是回答不了的,要回答这个问题很明显,首先有一个前提,就是商品落地页的调整,对于改进购买转化率来说,是具备可行性的。
这样你就可以把对象识别出来。
3. 选数据:从已明确对象身上去挖掘相关联的数据
选数据这件事儿,其实后半段不难,但前半段不太容易做
涉及到选择时间跨度,对象数据的维度等。
一句话,要有逻辑性。
4. 做分析:客观中立,从数据中洞察
分析这件事情,其实就是讲究,从数据中自然推导出结论,讲究客观中立。
不能带着结论去凑数据,也不能一脸懵比不要知道数据想要和你谈什么。
5, 再验证:带着数据告诉你的结论,反过来去看待最初的问题
我和小朋友说的是,数据要能够带来:
- 结论
- 假设
- 行动项
也就是说,一次数据分析,应该能够帮助你先认识到问题在现阶段的状况(结论),能够帮助你提出下阶段的可能性(假设),能够帮助你梳理接下来要着手做的事情(行动项)。
2 如何建立数据提取的逻辑
逻辑这件事情,非常重要。
重要到何种程度呢?
我见过刚开始做数据分析的小同学的分析报告,基本就是,堆一堆数据,然后说道说道,来了个结论,完。
我就问,为什么要取这些数据?这些数据之间有关联关系吗?是什么样的关系?
前两天,我的好朋友也是知乎大V的三水哥,写了个以毒攻毒去反驳三峡带来的负面影响的专栏文章,很值得一看,看了你就知道,有时候煞有介事堆砌的数据,其实根本就不存在因果关系。
那么,你花了几天时间去取了各种数据之后,堆叠出来的不过就是个你认为是正确的结论而已,这并没有价值。
建立数据提取的逻辑,首先是要训练自己的逻辑思维能力。
比较轻又有点小变态的训练方法是这样的:
随便拎起一个现象,就开始去做「找关系」的训练。
譬如,拿到一杯咖啡,你就可以开始训练了:
- 这杯咖啡是美式、拿铁还是其他什么类型的饮料?
- 美式和拿铁之间的差别就是拿铁是咖啡里加了奶,美式是咖啡里加水,可是为什么用机器做一杯美式所花费的时间会大于做一杯拿铁所花费的时间,甚至是双倍的时间?
- 多出来的时间究竟是哪一个环节影响导致的?
……
诸如此类。
然后,你要去和业务走得很近,要能够理解业务场景。
举个例子,停车场。
如果我问你,对于车,什么样的场景是最高频的?
我相信,至少50%的人会告诉我,停车、加油还有维修保养,尤其以停车、加油为主,甚至会有人说,停车是最高频的,因为车子只要开出去,就会停下来,而停下来就需要有停车的地方。
但实际上,我们所讨论的停车,是一个违高频场景,因为,假设车主是上班族,那么基本上在工作日,他是没有临时停车需求的,对于公共停车场是不存在热烈的需求的。
因为,家里和公司,都有相对固定的停车位。
但是,如果你不是车主,或者你离停车这种业务线很远,你要做数据分析的时候,你会有看起来很有sense但实际上完全错误的假设和逻辑。
所以,光有日常训练还不够,还要充分去理解业务,了解业务。
3 数据分析其实只要三页纸
这个真的不是开玩笑,当然,因为分析工作的深浅不同、所需数据量不同,其实三页纸也可以替换成三个部分。
那么,第一个部分就是,亮哥一再强调的,分析的背景、目的、选择的样本量、参照物,以及希望得出的结论的假设。
譬如说,原先的商品落地页上,用户的购买转化率不到0.01%,需要研究这种情况是否能够得到改善,由此我们选择了2000个用户,随机分为两组,A组看到新的商品落地页,B组维持原有的商品落地页,在30天的时间内,对比这两个小组各1000个用户的购买转化率的变化,参照对象分别是:
A组 VS B组在30天内的单人日均转化率;
AB组用户在看到该页面前后各30天的单人日均转化率;
假设商品落地页的转化率低是由于页面设计不合理和页面内容不满意,经过对新版落地页的调整,改善了页面设计和页面内容呈现的结果,希望通过本次数据分析,找到优化商品落地页,提升购买转化率的可能性。
第二个部分很简单了,把取到的样本、数据都列出来,进行参考对比,必要的数据解释工作可以先备注好。
第三个部分就更简单了,基于数据分析的结果,去反馈结论、提出假设与组织验证,即可。
所以,实际上每个数据分析的报告,其实就应该是这三个部分就好。
4 理解结论、假设与行动项
最后的部分,来举个例子,和大家说说结论、假设与行动项。
数据专员小王做了一份长达26页的数据分析报告,这份报告是围绕现有的内部渠道的运营质量进行的数据抽取和分析。
报告里洋洋洒洒列出了内部已有的多个渠道,在半年多的时间里这些渠道做了哪些内容投放,相关的展现率、点击转化率的统计,然后,结束了。
于是小王的领导老毛就和小王聊天了:
「这是你的数据分析报告?你为什么做这样一个分析?」
「因为负责渠道的同事提出了需求,希望了解渠道这半年来的相关数据。」
「是要数据,还是要分析?」
「要数据,但是要协助分析。」
「如果要数据,你提供一张Excel表格就可以了,但如果要分析,这个PPT是不合格的。」
「哪里不合格?我为了这个报告加了3天班……渠道那边说挺好的……」小王很委屈。
「或许他们觉得你帮他们做了数据美化工作,而且他们自己对数据分析的目的性想得不够多,所以才觉得挺好的,但在我这里,是不过关的。」老毛详细给小王解释:
「你看,你列出了这么多渠道的半年数据,拿其中一个渠道来说,我问你几个问题:
- 这半年来,通过A渠道,投放了36次,这36次针对的对象、内容有什么样的差别?对谁投放什么内容,在什么时间点投放的效果是最好的?反之,什么时候以什么形式,对什么人投放什么内容效果最差?你的结论在哪里?
- 如果你已经从数据中总结出了,在某个时间对某类人群通过某个形式投放的某一类内容的效果很好,那么,请问,这个渠道是不是只能在这个时间对这类人群用这种形式投放这类内容有效果,能不能在其他时间对其他人群换一种形式去投放不同内容,也能带来效果?你提出的假设是什么?
- 如果你已经提出了假设,你建议渠道那边的同事接下来应该做什么事情?是做一系列的测试回收数据,还是去改善渠道质量,还是在以后投放之前对用户选型和内容筛选先做一轮沟通?你建议的行动项是什么?」
小王越听压力越大,但也慢慢明白了老毛说的「不合格」是什么意思。
我们在做数据分析的时候,要始终有好奇心和责任心,通过一个小数据是可以洞察出很多问题的,而这些问题,不能仅仅限于提出,甚至是看到了但忽略的状况,否则数据分析就没有价值,可以不做。
拿一个实际的例子来说:
企业A的商业模式是按年收取固定单价的会员费,那么企业A的核心数据就是:付费会员率。
拆解这个率的时候,会有2个关联指标:
- 会员首次付费比例
- 会员续费比例
如果在数据分析中,发现续费率较高,但首次付费比例低,首先得出的结论是:
企业A提供的会员服务具有一定的价值,但对会员服务的表述及刺激用户成为付费会员的形式、文案、交易流程可能存在一定的缺陷。
接下来,去通过调取这些可能存在的缺陷点涉及的流程及数据去观察,是不是在这些方面存在问题。
如果是,提出假设,通过行动去验证。
所以,其实数据分析一旦启动,就不是一个单次的行为,它更像是一次实验的启动器,通过启动一个实验,来调校不同的业务发展的状态,寻找机会点,排除风险。
我希望大家都能有意识的去做结论、提出假设并制定行动项,这也是为什么我从来不单独提「数据运营」概念的原因,因为每个运营人,只要你有涉及的业务模块,你都应该具备「数据查询」与「数据分析」的职责和主观能动性。这才能让你提高的更快。