O2O商户运营成效评价:因子分析
因子分析主要用于分析商户O2O运营数据,了解商家的行为信息,找出数据背后的共性,最终对商家进行综合评价,挖掘商家特点。
应用背景
获得企业所属的商户O2O运营数据后,通过分析它们在一段时间内的线上线下行为信息,找出这些变量的共性,降低分析维度,对商户进行综合评价,可以知道产品运营效果是否达到预期。
分析方法
因子分析(探索结构,简化数据,综合评价)
分析工具
SPSS(数据分析的重量级应用,与SAS二选一)
实例:100个商户的O2O运营数据
一、基础知识讲解
因子分析的目的是什么?
- 探索结构:在变量之间存在高度相关性的时候,我们希望用较少的因子数目来概括其信息。
- 简化数据:把原始变量转化为因子后,使用因子得分进行分析,比如聚类分析、回归分析等。
- 综合评价:通过每个因子得分计算出综合得分,对分析对象进行综合评价。
因子分析的步骤
- 判断数据是否适合因子分析
- 构造因子变量
- 利用银子旋转方法使得因子更有实际意义
- 计算每个个案的因子得分
如何判断数据是否适合因子分析?
- 因子分析的变量要求为连续变量,分类变量不适合直接进行因子分析。
- 建议个案个数为变量个数的5倍以上,这只是参考值,不是绝对标准。
- KMO检验统计量:小于0.5时不适合因子分析;大于0.5小于0.7时,尚可以接受因子分析;大于0.7小于0.8时,比较适合因子分析;大于0.8时非常适合因子分析。
二、如何展开因子分析?
不瞎逼逼,直接开干。
【描述】
勾选“KOM和巴特利特球形度检验”,目的是用于生成检验因子分析适合度的统计指标。
【提取】
方法选择“主成分”,这是最常用的提取因子的方法;
勾选“碎石图”,用于辅助判断因子个数。
【旋转】
选择“最大方差法”,用于更好的解释因子所包含的意义。
最大方差法师最常用的,该方法能够使每个变量尽可能的在一个引子上有较高的载荷,在其余因子上载荷较低,从而方便对因子进行解释。
【得分】
勾选“保存为变量”,方法选择“回归”,用于保存计算的到的因子得分。
【选项】
勾选系数显示格式中的“按大小排序”,是为了让系数大小有序,方便观察;勾选“排除小系数”,输入0.4,这样在结果中相关系数小于0.4的会被排除,不再显示,也是为了方便观察(因为我们是寻找相关系数高的)
注意:这里不必生搬硬套,也不必也定时0.4,可视具体情况而定
分析结果解读:
该结果主要用来检验数据是否适合因子分析,主要参考KMO统计量即可。
KMO统计量为0.627,大于0.5小于0.7,尚可以接受因子分析。
这个结果是 “变量共同度”,显示了原始变量能被提取的因子解释的程度。
本例中所有变量共同度都在60%以上,可以认为所提取的因子对各变量的解释能力是可以接受的。
该图是“总方差解释”,显示了通过分析所提起的因子数量,以及所提取的因子对所有变量的累计方差贡献率。
累计方差贡献率大于60%,则说明因子对变量的解释能力尚可接受,达到80%,说明因子对变量的解释能力非常好。
本例根据“初始特征值”大于1的标准提取了两个因子,旋转之后累计方差贡献率达到72.367%,因子的解释能力较好。
碎石图”能辅助我们判断最佳因子个数,通常是选区取现中比较陡峭的位置所对应的因子个数。
本例前三个音字都在较陡峭的曲线上,所以提取2~~3个因子都可以对原始变量有较好的解释。
如何确定提取的因子个数?
- 初始特征值(总方差解释图)大于1的因子个数
- 累计方差贡献率(总方差解释图)达到一定水平的因子个数(如60%)
- 碎石图中处于陡峭曲线上的对应因子个数。
- 根据经验或研究,指定个数。
这是旋转之前的因子载荷矩阵,难以对因子进行明确定义,可以忽略不看,直接看旋转后的因子载荷矩阵。
“旋转后的成分矩阵”显示的是旋转后的因子载荷矩阵,这个结果能够凸显因子含义。
第一个因子:载荷较大的变量是“网店浏览量”、“论坛浏览量”、“线上广告费用”、“实体店访客数”,说明这四个变量与该因子的相关程度较高,其中前三个是反映的是线上数据,“实体店访客数”放映的虽然是线下数据,但是与第一个因子呈现反向关系。综上所述可以吧第一个因子命名为“线上商务”。
第二个因子:载荷较大的是“实体店铺货数”、“线下广告费用”、“地面推广引入量”,说明这个变量与因子的先关程度较高,并且反映的都是线下情况。综上所述可以命名为“线下商务”。
注意:系数是按我们设置的降序排列,并且有的为空,是因为我们设置的排除小于0.4的系数是因子结果更加清晰,可读。
这个图没什么卵用,忽略不计。
新生成了两个变量就是每个商户在两个因子上的得分:第一个因子的得分,第二个因子的得分。
三、如何计算综合得分?
下面我们计算综合得分。
公式:第一个因子占的加权比重数*第一个因子得分+第二个因子占的加权比重数*第二个因子得分
本例中旋转后的方差解释图知:
因子1贡献率为38.968%,因子2贡献率为33.399,累积贡献率为72.367
所以因子1占的加权比重数=38.968/72.367
因子2所占的加权比重数=33.399/72.367
对综合得分进行将序排列,就能知道哪些商户在O2O的运营方式下表现优异。
知道了那些商家表现优异,那些商户表现比较差,就可以进行后的详细分析,以提升企业的商业价值,达到某些商业目的。
作者:膝盖哥,是一枚“跪着提需求”的产品经理。常说“不用不用,真的不用了,我跪着就好!”
本文由 @膝盖哥 原创发布于人人都是产品经理。未经许可,禁止转载。