以互联网行业为背景下的数据分析通识(下)

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

编辑导读:数据分析听起来非常高大上,也是很多学生未来想从事的职业方向。在上篇文章中,作者介绍了数据分析如何入门、数据分析的基本流程,本文探索数据分析的进阶方法、数据分析的发展前景和优势,与你分享。

以互联网行业为背景下的数据分析通识(下)

我们上节内容,给大家介绍了数据分析如何入门、数据分析的基本流程,相信大家对入门数据分析的一些要求和入门方法都有了相应的了解。(详情请看:互联网行业数据分析通识(中))那么,我们在这里继续探讨,数据分析入门之后的一些事情,包括数据分析的进阶方法、数据分析的发展前景和优势。目的是给大家提供一个做数据分析工作未来的规划的方向,同时对目前职业状态也会有一个更全面的定位了。

七、数据分析进阶

1. 数据分析进阶的阶段

在入门阶段开始时,我们对数据分析基本流程有了一个概念的认识。那么,在进阶的阶段,要做的事情很简单,那就是:完善数据分析流程的基本面理解、更加深入地学习数据分析工具。

我们来看一下数据分析进阶的阶段:

以互联网行业为背景下的数据分析通识(下)

第一阶段:基本信息处理

大部分情况下,公司的数据体系相对已经比较成熟了,所有到你手上的数据都是相对比较干净和统一了,这时候数据分析的主要工作就是各种数据的提取以及数据处理。

这里面涉及到,整理并了解各种数据指标,搭建数据监控数据表格,包含日常数据监控表、渠道汇总表、销售明细报表、新增用户表等等,而使用的工具一般为Excel。而SQL在此阶段可作为辅助工具,从数据库提取和统计数据,然后导入Excel继续做表格,在这个阶段要突破的技能就是 :Excel的技巧和使用。

下面简单介绍一下,在进阶阶段,对于Excel的技巧应该要掌握到什么样的水平。

  • Excel的基本功能
  • Excel常用函数的使用
  • Excel数据透视表的使用
  • Excel的基本图表的使用

基本功能就不必介绍了,之前有一篇推文提及到,如果在推文里面的练习题你可以做到满分,说明你已经基本合格了。

(推文: Excel基础知识,Excel功能篇,Excel函数篇)

在常用函数上,你需要掌握如下的函数:

  • 聚合类函数,例如sumif,sumifs,countif,countifs,min,max等
  • 文本类函数,例如text等
  • 时间类函数,例如year,month,day,today,time等
  • 查找类函数,例如vlookup,lookup,index&match,find等
  • 判断类函数,例如if,iferror等

其他平时少用的函数,则大可不必花大量时间去研究,除非你立志要成为Excel表格大师。用的比较少的函数,在需要用的时候上网搜索相关资源即可,所以平时只需要掌握常用的这几类函数就足够了。

数据透视表的内容比较简单,跟BI工具的操作如出一辙:拖拉拽。将你想要透视的字段合理的进行规整,并适当的设置透视表的格式,当然如果你想考虑设计一个指标驾驶舱,并使用控件对驾驶舱数据进行更新,那么你还需要学习如何将透视表和控件参数进行联动的内容。

基本图表的使用非常重要,除了要学会Excel里面常用图表的创建方法,还需要学习如何用图表来准确的表达你想传达的信息。在图表设计上,表达内容比图表制作更重要,同时还要考虑基本的配色,来配合你传达内容的主题。如果在这一块想深入了解的话,这里面就是可视化的内容了。

Excel已经是非常成熟的软件,几乎所有使用技巧你都可以各种书籍以及相关的网站里找到并操练起来。如果数据量不大,且数据以数值为主,处理简单的计算逻辑,Excel基本就够用了。

而当你需要更强大的一些功能,比如对多张数据表灵活切换、分组、聚合、索引、排序,并且结合各种函数的使用,或采用到复杂些的数据分析模型、统计方法,则可进一步学习SQL以及学习Python的Pandas库进行更高阶的表格处理。

以互联网行业为背景下的数据分析通识(下)

第二阶段:学会SQL获取数据

此阶段,我们要知道如何去获取数据,其中最常见的就是从关系型数据库中取数,可以暂时不会R语言和Python,但是必须掌握SQL数据库语言。大数据时代,数据正在呈指数级增长,面临的数据量会大大增加,从GB,到TB,甚至到PB,非常可观。因此,有着固定行数限制的的Excel显然无法满足需求这种大容量数据的分析。因此,学习数据库语言就显得非常有必要了。

SQL数据库语言至少要掌握哪些内容呢:

  • “增”:新增库、表(create),新增数据(insert into),新增约束等;
  • “删”:删表(drop、delete)等
  • “改”:改表(alter)等
  • “查”:查表(select),过滤表(where、having、group by)等

基本的增删改查会了之后,还得学会高级一点的功能,例如:

  • 表运算(例如使用union进行表相加等)
  • 表连接(例如使用inner join进行表连接等)
  • 窗口函数

这时候就需要学习数据库。理解数据库和数据存储结构,会一点增删改查的数据库操作,因此,SQL是数据分析的核心技能之一,在这个阶段就是从Excel到SQL的数据处理效率进一步进阶。

我们经常说“学以致用”,“以用促学”,最好的学习方式就是练习,现在很多平台都有提供练习SQL语言的地方,例如牛客网、LeeCode网等等。经常刷刷题,保持做代码的感觉,是有必要的。

第三阶段:数据可视化展现

数据分析所有的流程里面,数据可视化是发现数据和展示结果的重要一环。试想仅将数据分析结果以数字报告或数字表格的方式呈现在老板的办公桌上,十年如一日,老板会有啥感想?

具备图表可视化能力,更加直观地展现分析结果,帮助管理层抓住数据本质,最好方式就是做出观点清晰数据的PPT和报表给老板看。可视化能力是这个阶段的数据分析人员必不可少的技能。

在数据可视化展现时,一般的工作场景中常见的就是Excel数据透视表功能,而且目前有WPS里有很多好的的可视化图案可供大家选择,还有目前现成的商业智能分析软件,如power BI或Tableau等,这两个工具都不要编程功底,实现起来简单,功能强大,BI商业软件可以满足你大部分的可视化需求,不过功能也会存在一些受限的场景。

然而,Python语言在数据可视化方面也有很多功能,比如Pyecharts等,使用编程语言的好处是更灵活、可以更好地适应特殊的需求。

推荐书籍:《用图表说话》-麦肯锡

第四阶段:数据贴合业务进行分析

从按月汇总的数据明细,各种业务信息、驱动因素、环境变量、变化路径,经过层层的汇总筛选处理,可能已经遗失了大量信息和数据,导致数据分析有所局限,很难对业务决策起到支持作用。

此阶段,贴合业务数据综合的分析,通过对业务的了解 ,基于业务的逻辑对数据进行分析,找到数据指标变动原因,通过发现业务问题点。这个阶段需要进行高阶的数据处理、加工和分析,通过Sql或者Python读取数据库的庞大数据,也是数据分析人员的必经之路。你会真正从数据的角度开始理解业务,洞察一切细节深究业务,也是在这个阶段真正的数据分析进阶。

第五阶段:数据驱动业务

在数据的领域里,整理了无数的数据报表,梳理了很多遍的业务逻辑,最后数据分析人员开始进入这个阶段:如何高效能的优化数据指标监控体系,让数据报表之间的井然有序,让数据分析更简单和灵活,让决策迅速而优化?能结合行业背景,利用数据挖掘工具,建置数据挖掘模型,发掘规律、商业价值、降本提效?

支持优化业务决策、发掘规律、商业价值、降本提效?这不就是数据的分析的价值所在么?因此 ,此阶段数据分析人员就需要建立复杂的多维的决策建模,使其更有体系,真正的实现数据驱动业务。就是将二维的平面数据报表,进阶到一个个立方体的多维宇宙,多方位的实现数据驱动业务增长,高效能的解决实际业务场景中遇到的大部分复杂工作。比如上千家门店的销售数据报表合并等。

小结:

总之,在数据分析进阶的过程中,有两个方面的能力:一是思维能力,包含财务思维、管理思维、业务思维、商业思维等;二是技术能力,主要是软件使用能力和数据展示能力等。可以说,分析工具是数据分析必备的硬件模块,它就像一双手。而分析思维,是数据分析必备的软件模块,它就像一个大脑。这两个方面的能力一直穿插在数据分析进阶的过程中,在不同的阶段不断的更新迭代、不断的提升。

2. 思维与数据分析

所谓的数据思维,其目标是让数据传达出真正的信息,且呈现出画面感,而不是一堆堆冰冷的数据指标。就像简历或者工作总结中,要体现活动营销转化率提升5%,创建企业率提升5%,会员业绩提升8%一样。数据分析思维是通过各种方法收集数据,了解需求,然后改进决策,不断迭代,降本提效。

在工作和生活中,我们应该通过不同的场景,来不断培养数据思维习惯。

如在工作中:

  • 在广告投放时,尝试去估算广告的受众群数量大小,渠道数量、成本和效果回收情况,想办法去拆解出各种影响因素、预期效果、投入成本等信息。
  • 在优化产品时,去梳理其商业模式、面对的用户群体、群体的使用场景,以及可能设置的付费点并去验证,同时想到可改进的价值点,并观察后续运营动作是否验证了改进点。
  • 在整理回访数据时,能通过线索来源,通话总次数,通话有效次数&时长,线索意向级别,销售司龄等数据维度来判断这组客户的意向度,缩短成单周期。
  • ·······

在生活中:

  • 观察并思考为什么滴滴打车你的价格高?可能你周围叫车用户多而司机少,也可能”其他原因”。
  • 观察并思考为什么微信订阅号文章改版后,有了点赞,还要增加在看?微信想加深用户粘性,让你看到更多朋友的世界,也让微信文章得到更多曝光。
  • 观察并思考为什么每个超市都鼓励办会员卡?因为要留住你,增加你选择去他们消费的机会,减少去竞争对手消费的机会。
  • ·······

小结:

以上是我们可以在工作和生活中需要培养数据思维习惯的思考场景,当然,不同场景产生差异化的行为,而数据分析思维让我们从数据上观察到这些差异,然而在实际工作中的前提是,我们要熟悉自己的业务流程以及业务指标等,我们在培养数据思维的同时数据敏感度会不断提升。

3. 工具与数据分析

数据分析的工具市面上也是有很多的,也在不断进化发展的,这时我们就需要根据公司业务情况进行选择。比如做市场研究、竞对分析经常会使用Python进行外部数据的抓取,统计分析领域常用到SPSS,以及调用地图开放平台进行地图可视化绘制。

对于数据分析进阶之路上,在不同阶段应用的工具也有所不同,Excel+SQL这2个工具在上述篇章作为入门的数据分析工具提过,这里就不展开介绍了,这里在进阶方面推荐一下Python+可视化工具。

1)Python

大多数人可能是从0开始,从未接触过编程,因而入门确实是有一定难度的。而更为关键的原因是,从数据分析进阶的过程中,从技能上来看,Python使用场景丰富,助益颇多,又语言简洁,适合新手学习。Python是一种面向对象、解释型计算机程序设计语言。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块轻松地联结在一起。

来看看Python能帮数据分析人员做到哪些:

  • 掌握Python语法,可以设计一些算法,解决数据分析模型中的一些复杂计算;
  • 熟悉Python可视化,可以处理后的数据用更多炫酷图表的方式展示,视觉上更美观,又直击重点;
  • Python连接数据库操作,连接多维模型,可以从零散的数据,到有一定数据规范和模型的数据海洋,优化数据结构,灵活的模拟业务决策;
  • ········

(作用太多了 ,就不一一列举了)

2)可视化工具

数据可视化工具,即将数据分析结果转化为图表,其终极目标是洞悉蕴含在数据中的现象和规律,目前市面上的数据可视化工具很多,但基本逻辑都是相通的。可从Power BI+Tableau两种工具开始。

  • Tableau将数据计算和美观的图表完美地融合在一起,可以在几分钟内生成美观的图表、坐标图、仪表盘与报告。是用来快速分析、可视化的强大工具,偏向商业分析。其特点:轻松整合,易上手,类似于Excel数据透视表/图的功能,可进行交互,能轻松制作美观的仪表盘、坐标图。
  • Power BI属于微软做的一个专门做数据分析的商业智能软件,先用PowerQuery处理和清洗数据,再用PowerPivot建模,最后用Power BI的图表库作图。其特点:与Excel无缝对接,创建个性化的数据看板,对于常用Excel的来说学习上手也相对容易。

小结:

除以上提到的Excel+SQL+可视化+Python等数据分析工具外,还有很多其他的工具,如SPSS、R语言等,大家在学习时,可以根据自己的实际需要来学习,不必要花费大量时间,做到样样精通。这些工具主要是能够帮助我们在短时间内完成复杂的数据分析计算过程,输出准确的数据分析结果,提高工作效率的。总之 ,在数据分析工作中,分析工具和分析方法是密不可分的,科学的方法结合高效的分析工具使用,才能提高分析效率和质量。

4. 数据进阶的知识点和书籍推荐(仅供参考)

  • 网络爬虫、SPSS、SAS、R语言等的学习:《SPSS统计分析基础教程》、《问卷数据分析-破解SPSS的六类分析思路》、《R语言实战》等书籍。
  • 数据挖掘算法得到学习:这部分相对来说还是比较难的,但是在工作中会去深化理解和学习,可以粗略的看看,等工作中遇到的时候再去针对性学习。学习资源有:经典的 《统计学习方法》,主讲分类算法,偏理论推导《机器学习实战》《机器学习》等书籍。
  • 数学知识的学习:概率论基础、独立事件、条件概率、全概率公式以及贝叶斯定律,有《概率导论》《线性代数》《概率论与数理统计》等书籍。
  • ·······

八、数据分析存在的挑战以及发展前景

1. 数据分析挑战在哪里?

1)入门容易,进阶难

“数据分析”越来越成为各个职业的必备的基本技能,各个职业上的从业人员都会开始学习数据分析,如运营、产品、技术、人力、财务都需要一些数据分析的思维和技能,因此,不只是从事数据分析领域的人员需要掌握的,别的职能也需要懂些基本的,尤其在互联网行业,要了解常用的基本分析框架和思维,简单的做个报表,读懂 A/B test,能做简单的决定等等。

但是呢,在数据分析这个领域,进阶非常难,在方法论以及思维方面,因为实际操作中有很多坑,而这些坑,通过在书本里是很难找到的,即使有也是非常零散。在技能方面呢,大部分人又从未接触过编程,因此,进阶的过程会有一定难度的。

2)不能有效推动业务,价值产出弱

互联网行业是一个构建在规模经济之上的、竞争相当激烈的行业,产品更新迭代速度快。只有快速迭代产品,更好、更快地满足用户需求,吸引足够多的用户关注与使用,获得快速增长,才能拿到融资、才能获得较好的现金流,否则很难生存下去。目前2C行业已经到了增长的天花板,竞争只会愈演愈烈。企业会更加在意数据分析的价值产出,希望以数据驱动的形式快速迭代产品,产生更多的用户增长和现金流。

但是呢,业务发展太快,导致人手不足,数据分析人员没法深入了解业务,没有贴合业务的数据分析产出的结果,并不能真正的推动业务增长,也不能很好的判断哪些需求的优先级,可能导致避重就轻。进而,缺乏数据分析落地的实例,进而循环往复。当然,这里面影响因素是多种多样,而且互相影响,就不一一展开了。

3)存在感不强,技能要求会越来越高

在很多时候不少公司又缺乏充足的落地的实例,于是行业整体看来,数据分析人员即不如技术类工种难度高、需求大,又不如产品类工种贴近业务,因此,其主要的工作是支撑业务部门,为业务部门提供各种数据用于业务决策。但业务方往往不清楚业务的真实需求,数据分析人员更加不太关注业务,沦为一个取数机器或者表哥等。最终,对工作的热情一定不会高,也会失去一定存在感。

但是呢,随着科学技术的进步、5G技术的成熟,整个互联网行业上将会产生越来越多的数据,这些数据呈现出越来越非结构化的趋势,数据种类也越来越多样化,这些数据包括文本、图片、视频、音频、网页、社交关系等多种数据类型,其处理方式也会更加复杂。因此,不光要懂SQL、Python等,未来的数据分析人员可能还要精通(至少要了解原理、会用工具)很多其他的数据处理技术。这无形给数据分析人员提出了更高的要求,工作也会更加有挑战。

2. 数据分析发展前景

在大数据和5G技术逐渐成为趋势的时代背景下,“数据”是越来越常见,如社交网络、消费信息、旅游记录……企业层面的销售数据、运营数据、产品数据、活动数据……

如何快速精准的对这些数据进行处理?

如何从海量数据中挖掘别人看不见的价值?

如何利用这些数据来做精准营销投放、优化产品、用户调研、支撑决策?

因此,运营、产品、市场、营销等工作岗位中数据分析是必不可少的一项技能!数据分析可以将数据的价值最大化!而从各大招聘网站也可以看出来,在薪资方面也是相当可观的!并且现在各个互联网的岗位都需要数据分析技能!

由此可见,在未来互联网职场中,“数据分析”技能无疑成为的标配!就数据分析前景而言,其发展路径无非是两条:要么在公司内部做数据分析,偏前端,重在业务分析,用数据分析赋能业务发展。要么数据挖掘方向,偏后端,技术能力要求更高一些,但对业务的理解是基础。而做数据分析更应该考虑如何用数据创造价值,如果你没有用数据创造价值的能力,那么就只能等着被数据淹没,沦为一个取数的或者做报表的机器而已,也就早早的到达职业的天花板。

这往往体现在数据价值的层面上,越往数据应用层靠拢,对数据产生价值的要求就越高,从事数据分析领域的人要常常自省是否有更好的商业意识、数据思维、业务理解能力、数据敏感度等,毕竟在公司层面,没人关心你是否比某个指标提高了一个百分点,公司关心的是你提高了这一个百分点之后,对公司产生的价值是什么。

那么,你就需要成为具备商业意识、数据思维、业务理解能力、数据敏感度等的高价值的数据人员,所以多多学习吧,别太约束自己,故步自封,多在行业领域内交流。

#专栏作家#

木兮擎天@,微信公众号:木木自由,人人都是产品经理专栏作家。多年互联网数据运营经验,涉猎运营领域较广,关注于运营、数据分析的实战案例与经验以及方法论的总结,探索运营与数据的神奇奥秘!

本文原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Pexels,基于CC0协议

给作者打赏,鼓励TA抓紧创作!

随意打赏

提交建议
微信扫一扫,分享给好友吧。