引入“比率”概念,让数据对比更严谨
在数据分析中,单个字段的对比在特殊场景下并不严谨,还有可能产生错误的分析与判断。而引入比率概念后,我们则可以更加准确地识别数据,做数据分析。
在上篇文章中,和大家一起分析了常见的“数据对比”,也通过“老王女装店中静默销售额”的案例提出单个字段的数据对比,具有迷惑性,存在陷阱。
由此可见,单个字段的对比在一些特殊的场景下是不够严谨的,容易产生错误的判断。
这个时候我们可以引入“比率”的概念,通过“比率”来破解这一数据对比陷阱,可以让论证结果更加严谨,更加科学。
下面让我们一起来讨论“比率”在数据对比中的意义。
一、什么是比率
“比率”在百度百科中的解释是,样本(或总体)中各不同类别数据之间的比值,由于比率不只是部分与整体之间的对比关系,因此比值可能大于1。
从“比率”的定义中可以发现,比率的值是多个字段经过了对比得到的值,这也是为什么它能更加严谨和科学的原因,通过计算比率过程中的对比,对不同的数据进行了一次标准化的过程。
例如下面这个例子,通过“客单价”这个比率对客服的销售能力进行了一个标准化的衡量,发现对于单个顾客的成交价格金额,客服甲的能力优于客服乙:
老王女装店的2个客服,客服甲和客服乙的今日销售情况 :
- 今日客服甲销售额3000元,成交人数为30人,客单价100元
- 今日客服乙销售额5000元,成交人数为60人,客单价83.33元(保留两位小数)
那么哪些字段算的上“比率”呢?常见的“比率”有3种,占比、转化率、平均值。
1. 占比
占比,是指一个总体中各个部分数量占总体数量的比重,反映总体的构成或者结构。
下面我们通过老王的店铺来看一下,在没有引入“占比”前,我们通过“团队销售额”和“全店销售额”两个字段,能得出两个字段的今日数据都比昨日有明显降低:
- 今日客服团队销售额10000元,全店销售额15000元
- 昨日客服团队销售额12000元,全店销售额20000元
通过对“团队销售额”和“全店销售额”两个字段的分析,发现“团队销售额”属于“全店销售额”的一部分(通常店铺销售额=团队销售额+静默销售额),符合“占比=占比数例值/总数值“。
通过计算“团队销售额”占全店的占比,就能够直观的发现客服团队对全店销售额的贡献度,发现今日“团队销售额”是降低了,但是对于店铺的整体贡献度更大,较为客观的衡量了店铺每天的销售情况,也便于店铺主根据这一数据调整对“客服团队”和“自然静默销售”的策略。
- 今日客服团队销售占比:66.67%
- 昨日客服团队销售占比:60%
通过案例可以推断出的“转化率”的通用公式:
公示:C字段=A字段/B字段
数据格式:
- A字段:总体中某个个体或部分的数据
- B字段:总体数据
- A字段是B字段的子集,或者说B字段包含A字段
- 单位:百分率(%)
占比,直观反映了个体占总体的比重,常被用于观察总体的构成情况(每个个体的占比起情况),监控个体在总体的变化(个体随着时间维度在总体的占比变动)。
2. 转化率
转化率,指一个周期或一个业务流程内,某一行为针对另一行为的转化百分率。
例如在电商客服中的一个接待周期,接待客户–>询单客户–>下单客户–>购买;在app中一个商品推广的业务流程,落地页–>购买页–>订单页–>购买。
在前一个行为进行到下一个行为的过程中,都会产生流失,转化率为我们分析不同行为之间的转化,以及一整个业务流程或周期内每个步骤的转化情况提供了数据支持和指导意义,同样来看下老王店铺的案例
最近,老王的店铺想要评估下整个客服团队在“接待”上的能力,老王收集了1月份客服团队“进店人数”,“询单人数”,“下单人数”,“付款人数”的数据。
单纯依靠这些数据,我们只能获得孤立的结论,比如通过“进店人数”,对老王店铺1月份的进店客户数的了解,能让我们对店铺规模有一个大致的概念,但是没有办法进一步评估客服团队的“接待”能力。
而通过4个字段的分析,4个行为的人数是逐级减少的,这也符合了一个接待周期的规律,但是仍然无法分析出“接待”能力。
老王店铺客服团队1月份接待客户的数据如下:
- 进店人数:10000人
- 询单人数:8342人
- 下单人数:2350人
- 付款人数:2139人
其实我们分析上述的4个字段,不难发现,其分别对应了“接待”客户中客户不同的4种行为——进店、询单、下单、付款。
4个行为属于一个周期内先后的4种客户表现:进店–>询单–>下单–>付款(每个行为非必须,比如客户进店后没有向客服询单直接下单付款),我们可以在每个环节引入转化率。就可以非常直观的了解客服团队在“接待”客户的每一个环节的流失情况,可以针对性采取一些措施:
- 进店–>询单转化率:83.42%
- 询单–>下单转化率:28.17%
- 下单–>付款转化率:91.02%
通过案例可以推断出的“转化率”的通用公式
公示:C字段=A字段/B字段
数据格式:
- A字段:行为1的数据或数据之和
- B字段:行为2的数据或数据之和
- 行为1和行为2同属一个周期,传递关系为行为2–>行为1
- 单位:百分率(%)
转化率是一个周期或者一个业务流程中,用户行为的直观和真实反映。能帮助我们对每一个行为进行监控和分析,也能帮助我们及时发现其中存在的问题,并采取对应的策略。常常被应用在业务流程中“核心和关键场景”分析,例如注册流程,电商的交易流程等
3. 平均值
平均值是数据分析中常用的比率之一,是数据之和除以数据个数后得到的值,反映的是数据的集中趋势,常常用来度量数据的一般水平。我们还是通过老王店铺的案例来理解平均值吧
老王的店铺又到了考核“客服绩效”的时候,其中有一项对客服销售能力的考核,我们仅从销售额和成交人数看,都无法很好比较出客服甲和客服乙谁的销售能力更强,因为两者的销售人数不同。
老王女装店有2个客服,分别是客服甲,客服乙 :
- 今日客服甲销售额3000元,成交人数为30人
- 今日客服乙销售额5000元,成交人数为60人
分析“销售额”和“成交人数”的关系我们发现,销售额是每个成交人数的成交金额之和,符合平均值的定义,可以引入平均值=销售额/成交人数,常常定义为“客单价”,通过“客单价”把不同度量单位的“销售额”和“成交人数”用“单位人的金额”统一了,直观的展示了两个客服的销售能力,发现客服甲的销售额能力强于客服乙:
- 客服甲的今日客单价100元
- 客服乙的今日客单价83.33元(保留两位小数)
通过案例可以推断出的“平均值”的通用公式:
公示:C字段=A字段/B字段
数据格式:
- A字段:总量,一组数据的数据之和
- B字段:数量,一组数据的数据个数
- 单位:C字段单位同A字段单位
平均值能较好的反映了一组数据的集中趋势,直观、简单的反映了一组数据的一般情况。
平均值与平均值的对比,也解决了不同数组之间单位不一致无法比较的情况。
平均值往往被应用于,描述和对比不同个体之间的优劣和效果,例如常见的客单价、件均价等。
二、总结
通过“比率”在数据分析和数据产品中,是一种常见的方法,能更科学和严谨的评估对比现象,得出的论证结果也较为全面,避开了单字段对比容易产生的陷进问题。
但是“比率”也存在一定的问题,例如下面的例子,运营同学单纯的从商品A的销售占比出发,确实可以发现商品A销售占比相较于活动前一天有很大的提高,得出了年货节的活动是成功的。
但是老王通过对当天销售额的查看,发现商品A的实际销售额是下降的,那么这次活动真的成功了吗?
- 年货节当天总销售额10w,商品A销售额8w,商品A销售占比80%
- 活动前一天总销售额20w,商品A销售额12w,商品A销售占比60%
从这个案例中我们可以发现比率也是具有一定迷惑性的,“销售占比”只能评估当天该商品的一个销售占比和权重,跨天比较就会存在误导性,所以在使用比率中,我们需要明确对比的对象。
本文由 @晌午 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。