万字长文详解手游类产品的数据驱动方法(上)
数据驱动 ,是指在重视数据的基础上,在公司内部搭建统一、完备的数据采集、存储、分析应用的系统,在产品调优、精细运营、精准营销中,通过实时的大数据分析,依靠数据洞察辅助决策,实现高速增长的过程。
以手游行业为例,分享企业产品、运营数据驱动的方法。
第一章数据驱动的意识
1.1游戏行业为什么需要依靠数据驱动?
游戏厂商现在面临一系列的挑战:政策收紧、头部效应明显、小游戏流量分流、新玩家增速减缓、玩家获取成本越来越高,资讯类、短视频类产品等抢占玩家时间的非同行竞争也日趋激烈。
据统计,传奇类与仙侠类产品的买量价格先后过百,在ios平台买量价格破两百的情况也屡见不鲜。获客难,利润薄已是大部分游戏厂商不得不面对的行业现状,通过买量和粗旷运营的方式已经难以为继。
在此情况下,提升用户留存、ARPPU和LTV,通过精细化运营实现用户与业务增长的方式,成为越来越多公司的选择。实现精细化运营的基础,是对渠道、产品和用户的全量数据,有准确、实时而全方位的认识,即通过数据驱动增长。在各个行业,数据驱动都受到了前所未有的重视。
运营效率高、单位获客成本低、用户活跃度高、用户留存时间长的游戏企业,能形成天然的行业竞争壁垒。而要实现这些,通过数据分析进行产品的精细化运营、营销与产品迭代至关重要。
比如买量投放,是否需要知道不同渠道上单个用户的获取成本与LTV?比如用户留存,不同渠道来源的用户,哪些渠道来的用户质量更高?比如活跃用户与非活跃用户的区别主要是属性差异还是行为差异?比如用户流失是渠道导的量不行,还是产品核心玩法未被体验?这些都是游戏投放、运营和版本迭代时的数据驱动应用。
简单测试你的团队是否拥有数据驱动的思维:
- 是否建立了公司/各部门核心运营数据的仪表盘?
- 在研发中和运营中的产品是否有核心数据的仪表盘?
- 开会沟通中是以“我认为”、“我觉得”打头,还是以“经过对上周用户数据的分析”、“经过对比测试”来说明问题?
- 对于你的业务,如何从数据出发找到增长点?
- 你的核心用户与产品的交互流程是否流畅,数据如何支撑?
如果你的团队已经建立了良好的数驱思维,这份白皮书分享的方法与工具能够帮你进一步理清思路、提高效率。如果你的团队尚未建立数据驱动的体系,这份白皮书中的数驱场景、优秀的数驱应用案例,也可以为你提供思路上的参考。
1.2游戏如何实现数据驱动?
对于游戏行业,有价值的数据主要分为三种,流量数据、玩家行为数据与游戏舆情数据,分别对应了市场买量、游戏运营与产品口碑三个决定游戏生死的核心事项。
流量数据是指不同渠道买量的用户基数、转化率、转化成本,通常掌握在第三方手中,通过用户画像与标签体系进行投放筛选,CPC、CPM、CPA等方式进行计价销售,游戏CP、发行商可控性不是非常强,对于不同渠道来源的用户,哪些会转为高频活跃用户、哪些转为核心付费用户的分析也不够细致。
玩家行为数据指的是玩家在游戏当中的行为,比如组队、升级、充值等。因为游戏业务的复杂性,和游戏玩家的活跃程度,这类数据体量非常大。因为量大,所以很多游戏公司只记录少部分数据,或者只是保留一段时间的数据,比如最近三个月的行为数据,这就导致如果要做精细的玩家行为分析就难于实现。
游戏舆情数据是指游戏玩家在论坛、贴吧、渠道以及游戏内各聊天频道的言论数据。这类数据内容庞杂,质量不一,在分析之前通常要利用算法做一层过滤,把无效信息剔除掉。再利用文本挖掘和自然语言处理的技术对有效反馈做数据挖掘,识别出玩家的观点和态度,用于指导产品版本迭代,同时也为我们了解用户,把握用户需求提供了科学依据。
那么,如何实现游戏的数据驱动呢?
首先,要具备数据意识。你可能已经听说过增长黑客、精益创业、MVP,其背后都隐藏着一个重要的基础:数据。阿利斯泰尔·克罗尔和本杰明·尤科维奇在《精益数据分析》一书中对数据的价值进行了详细的论述和说明。如果没有数据意识,其它都是空谈。
其次,要培养团队的数据分析能力。如何把业务和数据结合起来,找到业务的优化点和增长点,是一项非常重要的能力。分析能力的提高非一朝一夕之事,它往往来自于业务层的深度挖掘和思考,需要培养和积累。此外,它山之石可以攻玉,行业内案例的交流和分享是一种不可多得的好方式。
最后,数据分析的工具。受限于传统数据分析平台的性能问题,在日常的工作中要完成一个专项的数据分析任务需要一到两周的时间,而且大部分时间都花在“等数据”上。因为数据不能便捷,实时地获取,导致数据分析的效率低下,久而久之,看数据做决策的意识也就淡了。所以,一个高效、专业、灵活的数据分析工具非常重要。
以上三点,我们把它总结为数据驱动的道、术、器。要落地数据驱动,三者缺一不可。这也是数数科技的战略重心,提高行业的数据意识,增强行业数据分析的能力,并提供专业的数据分析工具。在游戏行业,把流量数据、玩家行为数据和游戏舆情数据完整地结合起来,充分发挥数据的价值,以提高整个行业数据驱动的能力。
第二章数据驱动的方法
通常,数据分析流程可主要分为数据采集、数据传输、数据存储、数据分析和数据可视化几个大的步骤。其中,在数据分析环节,不同的行业有不同的方法论,以下介绍一个较为通用的模型:海盗法则(AARRR)。
产品在不同阶段,需要关注的数据不同,海盗法则将其分为五个步骤:用户获取(Acquisition)、激活(Activation)、留存(Retention)、营收(Revenue)、推荐(Refer)。
- 获取环节:主要对渠道进行分析,判断渠道用户匹配度、单位获客成本、获客效率;
- 激活环节:寻找到活跃用户,仔细查看其行为序列,有必要的时候对活跃用户进行访谈,定义产品调性的往往是初期的活跃用户;
- 留存环节:健康的增长,不是拉新1000流失500,所以对用户留存的关注就非常关键;
- 用户增长:在此基础之上,为用户设计喜爱的病毒传播因素,往往能让用户成指数级增长。
那么从落地角度,如何做好用户的分析,以实现高获取、高活跃、高留存、高转化与高增长呢?
- 首先,需要设计精细的数据采集方案,打好企业数据驱动基础。
- 其次,需要掌握常用分析模型,根据运营和产品需求进行多维深度分析。
- 最后,借用合适的数据分析系统、学习优秀的数据驱动案例,在实践中不断优化。
2.1构建全面、精细、实时的数据采集体系的实战方法
一般而言,游戏行业整个数据分析的过程主要分为以下五步:
数据采集作为整个流程的基础,采集的质量在数据分析的过程中将起到决定性作用。常用的玩家数据可分为属性(User)数据与事件(Event)数据,而常用的数据来源主要包括客户端、服务端、业务数据与历史数据。
在游戏产品中,玩家所产生的数据相对其它互联网行业更为频繁与复杂。针对游戏产品,以下三步教你构建有价值的数据采集体系。
2.1.1全面的数据源
通过客户端SDK进行数据采集的方式,在游戏行业已经使用数年,然而受制于客户端网络状况的不确定性以及数据的有效性,仅通过客户端进行数据采集,往往会导致最终的分析结果存在误差并且深度有限,无法满足精细化运营的需求。相反,作为整个游戏上帝视角的服务器端所输出的数据显然更为准确深入,对于一些精确度要求较高的数据,建议使用服务端日志作为原始数据。
当然,客户端采集的方式也有其不可替代的价值,除了接入方便以外,玩家的部分客户端点击行为往往不会通知服务器,而这类行为可能恰恰反映了玩家的操作习惯,适合通过客户端进行采集。此外,除了上述两种数据源,游戏的业务数据库、历史游戏日志、第三方数据源等都可以在数据分析过程善加利用,提供价值。
基于各种数据源本身的特性,选择合适的接入方式所产生的数据方能全面精准地重现玩家在游戏各个时间段内的具体行为,夯实整个数据分析环节的数据基础。下面可以一起看下每种数据源的特性及其常用的采集方式。
由上可见,每种数据源都具有其不可替代的方面,我们应该跳出客户端埋点即游戏数据采集的固有思维,真正理解并运用各项数据源。当然,在融合不同数据源时,也存在很多“坑”,简单地举两个例子:1、不同数据源数据格式及含义都不同,需要做统一的数据ETL处理,从而能够在同一系统内交叉分析。2、不同数据源可能存在同类型的玩家行为记录,在采集的过程如不加梳理,反而容易使得后续的分析过程变得繁琐,所以在埋点的时候,对其进行有效地梳理工作,能够大幅提高数据埋点的质量。
2.1.2精细的数据维度
在其它行业的数据分析领域中,经常强调无埋点的数据采集方案,但无埋点仅采集标准化的用户交互数据,在数据维度的层面会有很大的缺失,例如无埋点采集能够获取用户购买的点击行为,但无法得知用户具体购买了什么商品,导致数据深度不足,分析的深度也随之降低。
游戏玩家的行为模式远比其它互联网行业的用户复杂的多,因而在数据采集的过程中,不仅需要关注数据的全面性准确性,数据维度也非常重要。举个例子:在采集玩家开始战斗行为的同时,除了事件本身,
建议将关卡ID、难易度、出战卡牌、角色等级、角色职业等相关信息一并落地,这样不仅能够分析玩家对于关卡的粘度,更可以通过这些维度发现关卡难度的平滑程度、卡牌的使用率及强度、角色的强度等等问题。
以下是游戏中部分主要玩家行为及其维度建议的案例,仅供参考:
基于上表,可以发现其实绝大多数的数据维度都是在代码埋点时唾手可得的,并不会添加多余的工作量,但基于这些维度,后续可分析的角度及深度将大大增加。多维度的数据能够为后续分析的深度提供保障,使分析过程不再局限于简单的事件统计,而是从各个角度去了解掌握玩家。
2.1.3实时的数据流转
数据实时性的重要程度是不言而喻的,无论是在服务器或活动的开启、还是广告的投放,都需要根据实时数据做出快速的反应,然而这一点往往也是很容易忽略的,数据分析人员一般认为客户端SDK在玩家产生数据后,短暂的延迟后即发往数据接收端,基本上可以说是准实时的,但却忽略了一个严重的问题,即数据流转时间。数据接收端的确准实时地收到了数据,然而这些数据是否可以实时查询,是否已经聚合到各个统计维度中,如果整个数据分析系统的数据流转是有延迟的,H+1甚至是T+1的,那么数据的实时性便无从谈起。
所谓实时的数据流转并不是指数据实时地从源端发送至数据接收端,而是指从数据的产生到数据真正应用于分析的整个过程是否是实时的。
实时的数据流转一直是数据分析中的一大课题,虽然各种分析工具中都有所谓的实时统计模块,但也仅仅是基于一些简单的重要的常规指标,例如DAU、当日充值等数据的展示,其覆盖面显然是不够的。开服过程中,运营人员需要实时地监测各个模块的实时情况,而非仅仅登陆和充值,譬如玩家新手阶段转化情况、首次充值时间、开服活动的参与,这些数据越早获取对运营决策的帮助越显著,而大多数分析工具往往要第二天才能输出该类数据。
目前对于实时的数据流转主要采用了流式数据处理方式,而与之对应的则是之前常规的批量计算方式,其主要区别如下图:
推荐采用流式计算方式:
- 与批量计算慢慢积累数据后按批次计算不同,流式计算将数据计算平摊到每个时间点上,连续地进行传输,数据持续流动。
- 计算结果上,批量计算对全部数据进行计算后落地结果并展示,流式计算是每次小批量计算后,立刻应用于在线系统,实时化展现。
流式计算看似与数据采集关系不大,实则息息相关,没有实时的数据流转,那么数据的实时传输也将没有意义。
可以说要想数据分析做得好,优质数据不能少。完备的数据采集体系至少是符合以上三个特性的,全面、精细、实时,基于此,后续的数据分析才能事半功倍。
2.2游戏行业最常用的5种分析模型
数据分析的基础模型涵盖方差分析、因子分析、回归分析、主成分分析、聚类分析、逻辑回归、用户细分等等,游戏运营的数据分析通常依据AARRR海盗法则相对精简,业内常用的数据指标体系可分为新增、活跃、留存、付费四大板块,相信大家对这类的宏观指标都比较熟悉,这里就不展开介绍。
这里我们将介绍在游戏数据分析领域常用的5种数据分析模型。通过这些模型,分析师可以把数据与玩家行为、市场投放、运营活动等因素结合起来,分析用户行为习惯,了解不同用户的群体特征,找到产品的优缺点,挖掘用户的潜在需求,为优化市场投放策略,制定运营方案和产品版本迭代提供科学依据。
2.2.1事件分析
- 事件分析的定义
事件分析是用来分析某一行为发生数量与趋势变化的模型,用户(USER)在项目上的任意行为定义为事件(EVENT)。事件可以通过埋点进行采集,利用采集到的数据直接对某一事件进行统计、计算、归类、展示时,称为事件分析。
- 事件分析的作用
利用事件分析模型的统计、计算、归类和展示能力,可以分析一段时间内,指定群体产生特定行为的趋势情况。从而对事件的影响和走势变化能够宏观把控,优化决策。
- 事件分析的业务场景
实际分析过程中,通过事件选框选择待分析的事件组,通过维度进行多分组同时展示,通过筛选条件下钻限制指定群体特征。通过时间、分析频率确定分析的适当范围,通过图表样式适应需要的表达形式。以游戏付费事件举例来说,可以解决如下问题:
- 每日的总流水金额趋势图,今日实时的流水情况。
- 上周各渠道的每日流水趋势,各渠道的流水分布情况。
- 来自上海的用户,最近一月人均付费金额的变化趋势。
- 对比上海和北京的用户,最近半年在购买会员卡上的付费次数与金额情况。
TGA系统快速实现任意事件分析
2.2.2留存分析
- 留存分析的定义
留存分析是一种专门分析用户参与情况、活跃情况的模型。
留存分析考查进行过某项初始行为的用户,在一段时间后进行回访行为的人数和比例,并可以对留存或者流失的具体用户进行下钻跟踪。
- 留存分析的作用
通过初始行为和回访行为的设置,可以灵活分析不同初始行为下,用户的整体参与程度、回访情况。根据回访行为的表现情况进行分析,探索和寻找“流失点”,从而对事件的影响能进行宏观把控,优化决策。
- 留存分析的业务场景
实际分析过程中,先确定需要分析的初始事件和回访事件,并通过筛选条件下钻限制指定群体特征。结合待分析的时间区间可得到在特定时间后的留存表和留存率趋势。
以新用户获取到消费转化举例来说,可以解决如下问题:
- 新用户登录后的次日,登录活跃的人数和占比情况。
- 新用户登录后的7日内,消费转化,且消费金额达到200元的人数和占比情况。
- 上海新用户登录后的1个月内,实现消费转化的人数和比例每日趋势变化。
- 一线城市新用户登录后的1个月内,进行登录,且消费金额达到200元的人数和占比情况。
- 新用户登录后的次日,没有登录活跃的人数和名单。并查看他们的行为轨迹。
TGA系统灵活实现多维留存分析
2.2.3漏斗分析
- 漏斗分析的定义
漏斗分析是一种分析用户一系列行为流程的转化模型。
漏斗分析考查指定用户群组,在完成了一系列行为流程后的转化人数和转化率,通过它可以分析每一步行为过后的转化情况。
- 漏斗分析的作用
利用漏斗的特性,可以帮助分析师快速掌握一段时间内产品在各个步骤环节中的转化情况,并且可以对不同分组的用户漏斗情况进行对比。从而达到找到转化短板、查缺补漏、优化转化流程的目的。
- 漏斗分析的业务场景
实际分析过程中,先选定需要分析的行为步骤组,确定每一个步骤的特定筛选条件,并且可以对不同分组的用户漏斗情况进行对比。根据每个步骤的转化情况进行分析,从而达到找到转化短板、查缺补漏、优化转化流程的目的。
漏斗分析创建的越细致越能找到重关联的事件可优化的短板,从而实现精细化运营。
以渠道投放到消费转化举例来说,可以按如下步骤创建简易的漏斗:
渠道投放——新用户获取——用户登录——开始新手教学——完成新手教学——开始战斗——充值消费
- 可以分析上述每一步的单步转化情况,确定漏斗短板。
- 可以对比不同渠道的用户在各步骤的转化差异,从而优化投放策略。
- 策略优化后,可以监测各步骤转化率的变化,从而确定优化的效果。
- 可以下钻分析完成或流失用户的行为序列,从而找到转化共性。
TGA系统自定义转化漏斗分析
2.2.4用户群分析
- 用户群的定义
用户群是一种将具有相同用户属性或行为特征的人汇总并归类的分析手段。
用户群模型利用用户的属性或行为特征,定期将特定人群归类。归类后的人群可以作为各个模型中筛选活用的基础。
- 用户群的作用
将具有共同特征的人组成用户群后,可以通过各种分析模型宏观了解人群的群特征,并微观洞察具体用户的行为序列轨迹。利用用户群在行为上的对比,来发现哪些因素影响短、中、长期的留存及收入,以对用户群进行精细化运营和定制营销策略。
- 用户群分析的业务场景
实际运用过程中,先选定需要限定的用户属性或行为特征,并根据需求选定用户群列表是否需要动态更新。利用设置好的用户群,可以在其他模型中灵活运营。
以游戏场景来说,可以创建如下的简易用户群:
- 大R玩家:用户累计付费超过200000元
- 新手期玩家:在最近7天做过用户注册事件,且用户等级小于20
- 首日充值用户:用户充值次数大于等于1次,且收否首日充值为真
- 节日活动参与用户:参与活动类型为节日活动,且大于等于1次
- 近期流失核心用户:在最近7天没做过任意事件,且在最近14天做过任意事件大于等于1次,且用户等级大于30
TGA系统多维度用户分群分析
2.2.5属性分析
- 属性分析的定义
属性分析是一种专门分析用户属性的统计与分布情况的模型
属性分析模型按照用户属性进行归类,可以同时查看不同分组值用户的统计数与分布情况。如查看用户在各省的分布情况、用户的年龄分布情况等。
- 属性分析的作用
利用属性的统计与分布模型,可以快速描绘出整体用户群的用户画像。多角度、全方位的掌握指定用户群的特征,宏观上把握整体用户的组成与偏好,从而为精细化运营提供依据。
- 属性分析的业务场景
实际运用过程中,先选定需要分析的用户属性项目,再选择进行分组查看的属性如省份。最后选择合适的分组值与图表样式即能呈现需要的用户画像,为精细化运营提供依据。
以游戏场景来说,可以得到如下的用户画像信息:
- 各省份用户数量的分布情况
- 20岁以下用户,在不同玩法下的消费钻石情况
- 在多个渠道上,各种机型的分布数量情况
- 对比大R、中R、小R群体,在用户等级上的分布情况
TGA系统自定义用户属性分析
本篇上篇分享了数据驱动的意识与方法,下篇将从数据驱动的工具与案例两方面进行分享。