【数据分析思维】多因素影响下如何归因？

人人都是产品经理 • 3年前扫码分享

编辑导语：随着移动互联网的兴起，业务的形态越来越复杂，归因分析的需求日趋增多。本篇作者就对归因分析进行了概念定义和罗列了6种常见的归因分析模型，以及实际在生活中出现的案例场景，一起来看一下吧。

【数据分析思维】多因素影响下如何归因？

一、什么是归因分析？

在所有数据分析师面对的分析问题中，有一种类型的分析十分费头发，但是业务中又会经常遇到，这种分析就是归因分析，先看以下两个案例：

案例1：小果在手机上看到了朋友圈广告发布了最新的苹果手机，午休的时候刷抖音看到了有网红在评测最新的苹果手机，下班在地铁上刷朋友圈的时候发现已经有小伙伴收到手机在晒图了，于是喝了一杯江小白壮壮胆回家跟老婆申请经费，最后老婆批准了让他去京东买，有保障。 那么问题来了，朋友圈广告、抖音、好友朋友圈、京东各个站外渠道对这次成交分别贡献了多少？

案例2：小丹在淘宝上买一双篮球鞋，通过首页搜索看到了AJ，点进去看了款式和颜色，觉得真香，无奈囊中羞涩，就作罢。五一期间，小明再次打开了淘宝，看到首页的优惠活动，点击进入活动分会场，再次看到AJ，点进去再过了一把眼瘾，想想下个月的生活费，又忍痛退出到了首页。但是，缘分就是那么神奇，在首页-猜你喜欢的页面再次看到了AJ，点击进去看了一下评论和买家秀，不管了，要剁手了。 那么问题来了，淘宝内首页搜索、活动会场和猜你喜欢这些站内的资源位对这次成交分别贡献了多少？

随着移动互联网的兴起，业务的形态越来越复杂，归因分析的需求日趋增多。上面两个案例分别是站外渠道和站内资源位两个经典场景下的归因分析。场景虽有所区别，但是目的都是相似的。即针对当前的场景和目标，怎么把“贡献”合理分配到每一个坑位上。

实际上这类问题其实并没有标准答案，因为真正的业务错综复杂，很难精准地把贡献进行合理的分配，但归因分析的需求又是如此高频且要求很强的时效性，所以需要一些方法论的支撑来进行快速尝试，快速定位问题而不至于面对问题一脸懵B不知从何处下手。以下介绍几种常见的归因分析模型供参考。

二、常见的归因分析模型

1. 末次归因模型

也称最后点击模型，这种归因模型将功劳100%分配给转化前的最后一个渠道，即不管用户发生了啥行为，只关注最后一次。这是最简单、直接，也是应用最为广泛的归因模型。

【数据分析思维】多因素影响下如何归因？

优点： 首先它是最容易测量的归因模型，在分析方面不容易发生错误。另外由于大部分追踪的cookie存活期只有30-90天，对于顾客的行为路径、周期比较长的场景，在做归因分析的时候可能就会发生数据的丢失，而对于末次互动模型，这个数据跟踪周期就不是那么特别重要了。

缺点： 这种模型的弊端也是比较明显，比如客户是从收藏夹进入商品详情页然后形成了成交的，按照末次归因模型就会把100%的功劳都归功于收藏夹（直接流量）。但是真实的用户行为路径更接近于产生兴趣、信任、购买意向、信息对比等各种环节，这些都是其他渠道的功劳，在这个模型中则无法统计进来，而末次渠道的功劳评估会被大幅高估。

适用场景： 短期的投放，转化路径少、周期短的业务快速提升，效果，按照末次归因模型，能比较好了解到底是哪个渠道对于最终的转化有比较好的促进作用。

2. 首次归因模型

也称首次点击模型，这种归因模型将功劳100%分配给第一个触达渠道，即不管用户发生了啥行为，只关注第一次。如果，末次互动是认为，不管你之前有多少次互动，没有最后一次就没有成交。那么首次互动就是认为，没有我第一次的互动，你们剩下的渠道连互动都不会产生。换句话说，首次互动模型更加强调的是驱动用户认知的、位于转化漏斗最顶端的渠道。

【数据分析思维】多因素影响下如何归因？

优点： 是一种容易实施的单触点模型，初次点击的归因会让你明确潜在消费者是怎样找到你的，且和最后点击一样，不需要大量的数据。

缺点： 受限于数据跟踪周期，对于用户路径长、周期长的用户行为可能无法采集真正的首次行为，且初次点击归因并不能够解释所有后续所发生的用户行为，对于后续的用户行为没有关注。

适用场景 ：一般是需要进行拉新的时候，公司处于市场开拓的时候，这个时候我们关心把更多的用户先圈过来，那么用首次互动模型可以看出来哪些渠道对于业务拉新最有效。所以首次归因模型对于没什么品牌知名度、且重点在市场拓展，渠道优化的公司，比较适用。

3. 线性归因模型

线性归因是多触点归因模型中的一种，也是最简单的一种，他将功劳平均分配给用户路径中的每一个触点。

【数据分析思维】多因素影响下如何归因？

优点： 它是一个多触点归因模型，可以将功劳划分给业务路径中每个不同阶段的营销渠道，不用考虑不同渠道的价值权重，大家一视同仁，计算也不复杂。另外，它的计算方法比较简单，计算过程中的价值系数调整也比较方便。

缺点： 很明显，线性平均划分的方法不适用于某些渠道价值特别突出的业务，对于价值比价高的渠道，可能会“被平均”，因为这种渠道是靠质量而不是数量赢得结果的。比如，一个客户在线下某处看到了你的广告，然后回家再用百度搜索，连续三天都通过百度进入了官网，并在第四天成交。那么按照线性归因模型，百度会分配到75%的权重，而线下某处的广告得到了25%的权重，这很显然并没有给到线下广告足够的权重。

适用场景： 根据线性归因模型的特点，它更适用于企业期望在整个销售周期内保持与客户的联系，并维持品牌认知度的公司。在这种情况下，各个渠道在客户的考虑过程中，都起到相同的促进作用。

4. 时间衰减归因模型

对于路径上的渠道，距离转化的时间越短的渠道，可以获得越多的功劳权重。时间衰减归因模型基于一种假设，他认为触点越接近转化，对转化的影响力就越大。这种模型基于一个指数衰减的概念，一般默认周期是7天。也就是说，以转化当天相比，转化前7天的渠道，能分配50%权重，前14天的渠道分25%的权重，以此类推……

【数据分析思维】多因素影响下如何归因？

优点： 这个模型考虑了时间的作用，因为一般情况下也是时间越久对于用户的转化作用是越弱。相比线性归因模型的平均分权重的方式，时间衰减模型让不同渠道得到了不同的权重分配，当然前提是基于”触点离转化越近，对转化影响力就越大”的前提是准确的情况下，这种模型是相对较合理的。

缺点： 如果有的渠道天然处于转化链路的起点，那么对于这些渠道是不公正的，因为它们总是距离转化最远的那个，永远不会得到一个公平的权重。

适用场景： 和末次归因比较类似，适用于客户决策周期短、销售周期短、引导用户完成转化的场景的情况。比如，做短期的促销，就打了两天的广告，那么这两天的广告理应获得较高的权重。

5. 位置归因模型

基于位置的归因模型，也叫U型归因模型，它综合了首次归因、末次归因、线性归因，将第一次和最后一次触点各贡献40%，中间的所有触点平均剩下的20%贡献。

【数据分析思维】多因素影响下如何归因？

U型归因模型也是一种多触点归因模型，实质上是一种重视最初带来线索和最终促成成交渠道的模型，一般它会给首次和末次互动渠道各分配40%的权重，给中间的渠道分配20%的权重，也可以根据实际情况来调整这里的比例。

U型归因模型非常适合那些十分重视线索来源和促成销售渠道的公司。该模型的缺点则是它不会考虑线索转化之后的触点的营销效果，而这也使得它成为销售线索报告或者只有销售线索阶段目标的营销组织的理想归因模型。

6. 自定义模型

你可以根据自己对于业务的理解，创建你自己的模型，让其具有更具体的业务性和目的性，并可将其来和其他默认模型做对比。

【数据分析思维】多因素影响下如何归因？

优点： 在这种模式下，你可以使用线性归因、首次归因、末次归因、时间衰减归因，以及位置归因模型作为基准线，通过不断地测试，调整各个渠道的权重，最好的效果是，它可以个性化地评估当前的业务，并可以随着时间的推移进行优化。

缺点： 在没有先做一些测试之前不要直接使用自定义模型，不要仅靠经验判断哪些渠道的贡献可能更大，实际数据上的表现可能会有所差异，需要基于数据的测试来进行判断。

三、归因分析的实际案例

以电商用户购物场景为例，用户进入App到最终产生支付购买行为，中间可能会有以下关键的渠道和坑位：

点击搜索栏进行搜索进入商详页
点击首页运营位进入商详页
通过点击push消息进入商详页
通过参与限时活动进入商详页
通过微信公众号推动消息进入商详页
通过购物车等坑位直接转化

我们对近30日成交订单进行归因分析，此处我们选用的归因计算方式是“末次归因”。归因窗口期设为 1 天，即观察用户在发生订单行为之前的 24 时之内点击了哪些坑位。然后再找到离“提交订单”最近的一个坑位点击行为。

【数据分析思维】多因素影响下如何归因？

最终得到的结果如上图，APP 内多个坑位中，点击搜索栏和直接转化对于成单的贡献分别占据了 52.67%、27.56%。运营位、活动、Push和微信公众号的相关推荐仅带来不足 10% 的成单贡献。通过这个结果，可以清晰地反映如下几点信息:

最终的贡献度反映了不同坑位对最终成单转化的贡献及互相之间的差异。
对比不同坑位的有效转化点击率，可得知不同坑位对用户的吸引程度。

以上就是数据分析思维—归因分析部分的内容，部分数据分析思维请翻看历史文章，更多数据分析思维的文章持续更新中，敬请期待，如果觉得不错，也欢迎分享、点赞和收藏！

本文由 @数据分析星球原创发布于人人都是产品经理，未经许可，禁止转载。

题图来自 Unsplash，基于CC0协议

给作者打赏，鼓励TA抓紧创作！