蜕变:从菜鸟到支付宝数据分析专家
分享实录:
大家好,我是来自支付宝的jerry,很高兴有机会跟大家交流做数据分析的一点心得体会。
一、数据分析与分析数据
理解业务的重要性不光体现在这里,对于任何业务的数据分析师,理解业务都是第一位的。比如有一些数据分析师刚到一个新公司,对业务有一个大概的了解,马上就以巨大的热情去探索这家新公司到底有哪些数据,每一张表,每一个字段的含义,可以做哪些分析,这样扎在数据的海洋里可能一个月都出不来。这样做会有很多弊端:
1、效率非常低,你很容易被数据表之间的各种关联关系搞混乱。
2、你知道数仓有这个数据,但你不知道这个数据是怎么来的,你对数据的质量无法把握。
3、 你只知道数仓里有这些数据,但你不知道数据仓原本还可以有其它数据,只是这些数据没有被记录和存储下来而已,这一点尤其重要。
正确的做法到一家新公司后先花一到两周的时间,去理解公司的业务和产品,尤其是自己负责的业务,要理解每一个环节和分支流程,在理解业务的过程中可以想该业务可以沉淀出哪些数据, 反过来用数仓的数据去印证你的思考。如果发现有没有想到的数据,那这部分就是你忽视的产品流程或分支,如果有你想到而数仓没有的,那可能就是还没有分析角度的或者记录的。
理解了业务,也就理解了数据是如何产生的,你才能理解数据背后的含义、以及数据的准确度。我们在分析APP的时候,经常需要统计页面的UV、PV。你问技术要统计口径时,可能服务端和前端都会给你一个口径,并且两套口径的数据可能存在较大的差异,你拿着两个口径的数据可能就蒙圈了,不知道数据为什么会差很多,到底哪一个才是准确的。但假如你了解服务端和前端的数据采集机制,知道服务端记录的是用户要查看这个页面的请求数据,前端埋点是加载资源完成渲染的数据,两个数据之间的GAP很可能就是因为前端的性能问题导致页面没有渲染成功,此时你不但不会纠结哪个数据是准确的,而且马上就可以把这个作为你的分析突破点,去分析前端是否存在性能问题。
当然,现在的互联网行业产品迭代都很快,人员流动也比较频繁,一个上线才1年的产品,可能已经换了好几个PD和技术了,你要完整了解产品的各种流程会非常困难,因为PD和技术都不一定能够了解所有的分支。但这个时候,作为数据分析师的优势就来了,你除了可以亲自体验产品流程外,还可以通过数据来印证你对产品的理解。一段时间下来,你会发现,你对产品的了解可能比产品经理和技术还要深入,如果达到这个程度,我觉得你就具备成为一个优秀的业务数据分析师的基础了。
二、成为业务与数据的桥梁
我们可能都碰到过这种情况,产品说我提了埋点需求,技术说所有的埋点我都做了,数仓说我把数据都同步了,但听完所有人的话,你发现你还是不知道怎么去取数据。原因就在于每个人都在讲自己的工作,不了解别人的工作模式,也不知道他们的工作在数据上的影响。这就需要一个人作为桥梁,他能了解产品、技术、数仓的工作模式,把沟通拉回同一个频道,而最后你会发现只有分析师才最适合这个角色。优秀的分析师不光要懂数据,还要懂业务,还要懂技术。
三、打造业务分析体系
指标体系的建设步骤通常是:确定业务目标、分解指标、确定每个指标的数据口径、搭建成一个完整的体系。业务分析体系包含探索分析、日常监控、异动排查、优化产品4大块。
两者的差别在于指标体系只是数据分析师提供给业务方的一个工具,而业务分析体系是一个以数据为基础,集日常监控、异动排查、优化产品为一体的能够自我良性循环的体系。业务分析体系的主要特征 是:以数据为基础,以改进产品和业务流程为目标。业务分析体系是一个体系而非系统,并非每个环节都要有产品。
如何打造业务分析体系?
1、要以产品经理的思维去打造,明确优先级,以快速迭代的方式更新业务分析体系,同时需要多方面的配合和主动推进。
2、给其他人提需求,而不是等别人给你提需求。给别人提需求可以控制工作节奏、化被动为主动、加强对业务的思考、思考长远目标。通常需求对象包括:一是给你提需求的人;二是产品、技术、数仓。
3、业务分析体系是长期的目标,数据分析师要将产品优化、业务优化纳入我们自己的工作范围内,就像业务催你要数据一样,去催产品和技术,结合我们的建议,去做产品的优化、改造和效果跟踪。
Q:传统企业如何做数据分析?
A:不管传统还是互联网企业,如果要做数据分析,就应该先了解业务流程,分析当前业务流程中存在哪些痛点,初期多和各个部门业务人员访谈来帮助你了解业务和发现痛点。
假如你是一家生产型性企业,可以从人员安排,物料运转, 产品的合格率,库存的挤压,周转周期方面着手,分析是否存在人员的优化、减少成本、提高效率的空间。如果你还有一定的行业相关知识,也可以从行业的大环境出发,预测行业环境的变化对公司潜在的影响,从而在战略层面给公司提供建议。
Q:请问真正的数据分析是什么样子?最近在自学python 数据分析,然后学了一点统计学,一点python,但是不知道实际工作中究竟如何来用python数据分析的。
A:从数据分析的角度,最适合的工具就是sql+底层的数仓,也可以是mysql一些开源的软件,python和Java里的数据分析更适合于在算法团队,就是做一些在线的模型算法和推介。
Q:常用的数据分析工具方法有哪些?做数据分析工作快2年了,发现我经常用到的分析工具竟然是excel,最多做的统计还是描述性统计。偶尔会用到关联分析和一些检验验证,但是也仅限于偶尔,但是又因不是统计学科班出生,在做分析时底气不足,所以想问问老师 在数据分析时方法有哪些?我该如何得出结论?
A:这是新手数据分析师的常见问题,就是不知道结论的正确标准是什么。在企业中即使你拿出统计学中通过显著性检验的结论去跟业务部门沟通,他们也不知道你在说什么。其实在数据分析领域,我们更看重的数据分析师的商业嗅觉和逻辑思维能力, 表现出来就是对数据的解读能力,同样的数据在不同的数据分析师眼里给出的建议是不一样的。对我来讲一个有价值的结论标准需要具备两点:一是商业逻辑准确,二是结论具备可操作性。
End.