想成为数据产品经理，先掌握这些数据分析方法论（二）

人人都是产品经理 • 5年前扫码分享

之前在《想成为数据产品经理，先掌握这些数据分析方法论》一文中，分享了一些基础的数据分析方法，从业务分析、用户分析和产品运营三个方面提供了一些分析的切入角度。接下来，进阶一步，我们再来看看还有哪些实用的分析工具。

一、业务分析：如何做诊断归因？

在《想成为数据产品经理，先掌握这些数据分析方法论》一文中分享过杜邦分析法，杜邦分析法是财务中常用的拆解指标的方法，可以将核心指标拆解为多个因素乘积的形式，如GMV=访客数*转化率*客单价。

在做完指标拆解后，应该如何进行进一步归因呢？本月GMV上涨了，是访客数增长的贡献还是转化率上升的结果，抑或是因为客单价的提升？

为此，我们需要引入另一个在财务领域广泛应用的分析方法——因素分析法。

1. 因素分析法是什么？

因素分析法是在将核心指标拆解为多个因素后，识别各因素对核心指标影响程度的一种方法。

我们将指标拆解后，当然，可以用控制变量法来计算每个因素的贡献，比如，假设上月的GMV、访客数、转化率、客单价分别为GMV ₀ _、 V ₀ 、T ₀ 、M ₀ ，本月的GMV、访客数、转化率、客单价分别为GMV ₁ _、 V ₁ 、T ₁ 、M ₁ ，那么

GMV ₀ =V ₀ *T ₀ *M ₀

GMV ₁ =V ₁ *T ₁ *M ₁

我们要判断访客数，也即流量的贡献，按照控制变量法，假设转化率和客单价与上月一样，访客数变化所带来的GMV提升为：

Attr_V=V ₁ *T ₀ *M ₀ – V ₀ *T ₀ *M ₀

同样，计算转化率贡献的公式为：

Attr_T=V ₀ *T ₁ *M ₀ – V ₀ *T ₀ *M ₀

这里用到的是传统的控制变量的思想，但要使用控制变量法需注意一个前提，那就是各个变量之间要相对独立，但真实情况下，各个因素之间都是相互影响的，很难保证独立性。

而因素分析法所采用的是连续替代的方法，在计算下一个因素的贡献时，会考虑到上一个因素的变化，可以有效地规避控制变量法中不独立的问题，我们具体看一下如何操作。

首先，我们在上月GMV ₀ 的基础上，用本月的访客数V ₁ 替换V ₀ ，接着再依次用T ₁ 替换T ₀ ，M ₁ 替代M ₀ ，可以得到：

上月GMV：GMV ₀ =V ₀ *T ₀ *M ₀ ①

第一次替代V：V ₁ *T ₀ *M ₀ ②

第二次替代T：V ₁ *T ₁ *M ₀ ③

第三次替代M：V ₁ *T ₁ *M ₁ ④

而每一次替代前后的变化，就是对应因素的贡献值，即：

Attr_V=②-①

Attr_T=③-②

Attr_M=④-③

GMV ₁ -GMV ₀ = Attr_V+ Attr_T+ Attr_M

2. 举个栗子

下面，我们举个实际的例子来熟悉一下上述方法。

假设9月和10月的数据如下：

想成为数据产品经理，先掌握这些数据分析方法论（二）

那么，用因素分析法依次替代后的结果如下：

9月GMV：GMV ₀ =V ₀ *T ₀ *M ₀ =12w ①

第一次替代V：V ₁ *T ₀ *M ₀ =15*1%*60=9w ②

第二次替代T：V ₁ *T ₁ *M ₀ =15*2%*60=18w ③

第三次替代M：V ₁ *T ₁ *M ₁ =15*2%*70=21w ④

各因素的贡献率分别为：

Attr_V=②-①=9-12=-3w

Attr_T=③-②=18-9=9w

Attr_M=④-③=21-18=3w

想成为数据产品经理，先掌握这些数据分析方法论（二）

由此可见，10月的访客数较上月有所减少，导致了3w元GMV的流失，但流量显然更精准，转化率明显提升，且转化率的贡献最大，带来了9w元的GMV增量，此外，流量质量也较高，客单价有所上涨，带来了3w元的GMV提升。

因此，后续应该加强流量的引入，转化率可以分渠道进一步分析，针对高转化率的渠道进行重点运营，而客单价可以进一步分析是产品价格提升了，还是用户买的产品数量更多了。

因素分析法的作用，就在于可以找到关键的正向或负向因素，当精力或资源有限时，可以有的放矢，重点解决关键问题。

3. 替代顺序如何确定？

看到这里，不知道大家有没有发现，如果改变一下替代的顺序，各因素的贡献值会发生变化，比如，如果先替换客单价，那客单价的贡献值肯定跟上面的结果有所差异。

那么，我们应该如何保证因素分析法的有效性呢？

因素分析法是建立在某种前置假设的逻辑之下的，既然无法将各因素割裂进行分析，那么就依次考虑各因素的叠加效应，而这个次序需要遵循实际经济意义上的先后逻辑。

比如，以上述的访客数、转化率和客单价为例，自然是先有访客到访浏览，才会有下单转化，之后才会产生交易金额。也即先得有人来，来了才会决定买不买，决定买了再看花多少钱买。

同样，如果我们把GMV拆成价格*销量，那么应该先考虑价格的贡献，再计算销量的贡献，因为是先定价，才会有销量，而且销量很大程度会受到价格的影响。

二、用户分析：如何分析品牌认知差异？

网络社交媒体和电商平台中沉淀着大量的用户反馈信息，通过舆情的挖掘分析，可以为品牌商提供多角度的参考建议，指导品牌商进行产品或服务的优化。

很多品牌商都会定期找调研公司进行调研，从而了解用户对品牌的认知，以指导下一阶段的品牌形象建设或品牌差异化策略。

有很多调研的分析方法同样适用于舆情的分析，接下来就分享其中的一种——对应分析。

对应分析(Correspondence analysis)也称关联分析，是一种多元相依变量统计分析技术，是通过分析由定性变量构成的交互汇总表来揭示变量间的联系。

简单来讲，其实就是先将各类变量放到一起进行相关性分析，把关联度高的进行归类，达到降维的效果，如将为二维（两个分类），接着，再看各变量在这个二维空间中的位置，最终判断变量间的关联性。

对应分析与因子分析的差异，就在于因子分析是针对一个变量中的值进行归类，看的是相同变量的相似性，如老鹰和麻雀都可归为鸟类，而对应分析包括多个变量，还能看不同变量的关联性，如老鹰（鸟类）与食物（鼠）的关联度高，麻雀（鸟类）与谷类（食物）关联度更高。

对应分析的具体原理在此不做赘述，大家感兴趣的话可以上网查阅，接下来，我们看一看实际的例子（数据都是我编的，如有雷同，应该是抄我的）。

1. 基础入门：简单对应分析

现在，假如我们将用户的评论、反馈数据，通过切词、归类编码后，得到以下数据表：

简单对应分析适用于两个变量交叉分析，我们先选“品牌”和“认知”这两个变量来进行对应分析。

在很多分析工具中都有对应分析的功能或程序包，我们以SPSS为例，在SPSS菜单中选择【分析】-【降维】-【对应分析】，选择行列分别为“品牌”和“认知”，可以得到以下摘要表：

我们看到显著性sig=0.000<0.01，卡方检验通过。

然后，观察第一列“维”（也就是所谓的归类）和后面的累积惯量比例，可以看到维1和维2加起来的累积惯量比例已经达到99.5%，也即用这两个维度已经可以解释“品牌”和“认知”这两个变量中99.5%的信息。

接着，我们可以得到具体类别在这两个维度上的得分，生成对应分析图如下：

通过对应分析图分析关联性目前有多种方法，如向量分析、理想点与反理想点等。

这里我们用最简单的观察法进行定位分析，首先标出几个品牌的位置，然后观察品牌认知的形象词与品牌的距离，距离越近，说明关联程度越高。

至此，我们可以大致判断出各品牌在消费者心目中的形象。

2. 进阶拓展：多元对应分析

简单对应分析比较直观，但其缺点在于只能分析两个变量。如果我们除了分析品牌形象以外，还想看看各类型用户对于品牌认知的差异，那么就需要用到多元对应分析。

在SPSS菜单中选择【分析】-【降维】-【最优尺度】，选择分析变量为性别、年龄、品牌、认知，最终生成结果如下：

从图中可以看到，50岁以上女性更偏好悠悠诗，她们觉得悠悠诗是“高端的”。40-50岁人群更偏好星七克和雀窝。

多元对应分析的信息量相对较大，可以得到更丰富的解读，但理解较为困难，可酌情选用适宜的方式进行分析。

三、产品运营：如何评估产品功能价值？

之前的文章中讲到了评估产品使用广度、深度和粘性的指标，用来监控产品当前的使用状况。

但该方法只能适用于产品上线之后的效果评估，而在实际工作中，产品经理们还经常遇到另一类更为频繁且棘手的问题，那就是——没有资源，排不上期！

需求总是呈井喷之势，而资源始终是挤牙膏状态，产品经理平日做的最多的事就是进行需求评估，通过形(pai)而(nao)上(dai)的方法，将需求拍出，额，不对，排出优先级。

那么问题来了，我们应该怎样进行优先级的评估呢？

同样，我们可以向传统调研取取经，接下来，就跟大家分享一个方法——Kano模型。

1. 理论基础——双因素理论

在讲Kano模型之前，我们先熟悉一下这个模型的理论依据。

了解过组织行为学的同学对双因素理论肯定不会陌生，双因素即“保健因素”与“激励因素”，美国行为科学家赫茨伯格认为，满意的对立面并非不满意，而是没有很满意，而不满意的对立面也不是满意，而是没有不满意。

一段绕口令后，我们举个实际的例子，公司福利、公司政策、工作环境，这些因素容易引起员工的不满，但如果满足了这些基本条件，员工就会满意了吗？

这些在员工看来只是基本的“保健因素”，就像每天都能吃饱并不能使我们幸福一样，而个人成就、社会认同、个人成长，才是能给员工带来满足感的“激励因素”。

赫茨伯格认为“保健因素”来自于外部环境，而“激励因素”是一种内在激励，马斯洛底层的生理、安全和感情需要都可以认为是“保健因素”，而自我实现等高层需求属于“激励因素”。

说白了，放到产品的语境下，就是有的功能是必需的，但不能让用户爽，而有的功能真的可以让用户感到爽，激发用户的“Aha Moment”。

2. 研究方法——Kano模型

Kano模型的底层逻辑和双因素理论一样，在做问卷调研时，一般会问正向和负向向两个问题，即：

正向：有这个功能，你的态度
负向：去掉这个功能，你的态度

依照此方法，对于每一个功能，我们都可以收集并汇总统计用户的态度数据。

基于上面的数据统计，可以进一步计算出Better-Worse系数，表示该功能可以增加满意/消除不满意的程度。

增加后的满意系数：（A+O）/(A+O+M+I)

消除后的不满意系数： -1*（O+M）/(A+O+M+I)

我们将所有功能的Better-Worse系数放到一张图上，就可以对功能进行归类分析了。以手机为例，构建假数据制图如下：

魅力因素：非必要需求，但可以给用户意外惊喜。
期望因素：用户很期望被满足的需求，没被满足的话会很失望。
必备因素：必要的基础需求，有的话很正常，但绝不能没有。
无差异因素：用户不太在乎，有没有都无所谓。

通过象限图我们可以看到，双屏可折叠等黑科技非常吸人眼球，虽然不是必需的，但却可以大大提升满意度。

AI摄影、超长待机等功能属于期望因素，跟用户的满意度有很大关系，所以很多手机品牌商不断在摄影功能、待机时长上做文章。

高性能处理器、大尺寸、指纹识别已经逐渐成为必备因素，这与行业的教育引导有关，当大家都习惯了用手机打游戏、看视频，高性能、大尺寸自然会成为必要条件。

还有一些功能虽也有所创新，但比较鸡肋，用户不太关注，如type-c接口、无线快充。

Kano模型比较适用于产品的需求调研，无论是前端产品还是后端产品，先可基于定性访谈收集需求，再收敛需求进行定量调研。

针对期望因素和必备因素，需要重点维护及迭代优化，而魅力因素属于亮点功能，有时间精力可以逐步加大投入。对于无差异因素，应当减少维护和运营的成本，甚至将功能下架。

每个功能所处的位置并不是静态的，甚至往往会随着时间推移发生很大的变化，就跟产品都有生命周期一样，功能也会有自己的生命周期，定期运用Kano模型进行产品功能分析，可以帮助我们掌握需求变化，从而指导下一阶段的产品升级。

#专栏作家#

Mr.墨叽，公众号：墨叽说数据产品，人人都是产品经理专栏作家。电商行业资深产品经理，擅长策略构建，数据分析。

本文原创发布于人人都是产品经理。未经许可，禁止转载

题图来自Unsplash，基于CC0协议

想成为数据产品经理，先掌握这些数据分析方法论（二）

一、业务分析：如何做诊断归因？

1. 因素分析法是什么？

2. 举个栗子

3. 替代顺序如何确定？

二、用户分析：如何分析品牌认知差异？

1. 基础入门：简单对应分析

2. 进阶拓展：多元对应分析

三、产品运营：如何评估产品功能价值？

1. 理论基础——双因素理论

2. 研究方法——Kano模型

#专栏作家#

随意打赏

2025 年中国新媒体行业发展规模分析新媒体用户规模持续扩大

竹芒科技发布彩宝3.0 Pro，以用户体验+智慧运营宣告共享充电3.0时代到来！

雄安体育中心正式运营 “人民之城心向往之”雄安城市体验活动同时启动

2025 年中国机器狗行业市场供求分析机器狗产品单价仍较高

“海湖庄园协议”总设计师谈：特朗普想要做什么？

云迹科技机器人服务智能体落地锦江集团多家酒店提升用户体验

运营交付100天！九识Z系列2025款引领产品设计再升级

值得买消费产业研究院发布《2024年度消费数据报告》：兴趣消费满足多元需求，科技赋能提升用户体验

神策数据接入 DeepSeek，AI 赋能数据分析与智能运营

30秒定制专属AI助手！YiduCore+DS让中肿医生「化身」AI产品经理

洗地机行业服务革命！MOVA X40 Pro才是以用户体验为中心的真担当

明略科技全域营销分析平台：实时数据智能洞察，AI助力敏捷营销实效评估

做用户研究，新手常犯的那些错误

谷歌Gemini AI向免费版用户开放文件上传/分析功能

有数ChatBI正式接入DeepSeek大模型，让数据分析更加智能高效

2024 年中国数据中台行业需求市场分析多因素驱动需求增长

诸葛io助力城商行打造用户行为分析平台，斩获两项金融数字化大奖

NeuroBlade在亚马逊（Amazon） EC2 F2 实例上加速下一代数据分析

2024 年中国数据中台发展现状分析实现数据价值化的重要工具