文科生如何七周内入门数据分析?
作者:软件定义世界
引言
本文是TalkingData某项目组成员在项目过程中由于项目需求被逼学习数据分析的资料分享,作者是一个文科生,七周之内掌握基本的数据分析知识,希望能帮助想要入行的文科同学。
目标人群:适合之前工作不需要自己上手做分析、或者对付大量数据的少数群体。
学习预期:七周下来之后只能是会,但不是掌握,工作当中常用的问题可以熟练应用。
学习时间:每周5-10个小时。
材料来源:这个学习计划以一位小米的游戏分析师版本为基础,根据零售的特点和需求以及自己使用下来的经验做了调整。
学习原则:分析只是方法,思维、逻辑、业务影响更为重要。我们是菜鸟,时间有限,不走fancy路线,工作用什么我们先学什么。
1.第一周:Excel
Excel函数:
https://zhuanlan.zhihu.com/p/23345231
主要简单讲解常用的函数,以及与之对应的SQL/Python函数。
Excel技巧:
https://zhuanlan.zhihu.com/p/23618955
主要讲解有性价比的功能,提高工作效率,养成一个好习惯,不要合并单元格,不要过于花哨。表格按照原始数据、加工数据,图表的类型管理。
Excel实战:
https://zhuanlan.zhihu.com/p/24084300
主要将前两篇的内容以实战方式进行,简单地进行了一次数据分析,每个task一定要练熟。数据源采用了真实的爬虫数据,是5000行数据分析师岗位数据。
附加一道练习题,给1000个身份证号码,描述里面有多少男女,各省市人口的分布,这些人的年龄和星座。(身份证号码规律可以网上搜索)
下面是为了以后更好的基础而附加的学习任务:
- 了解单元格格式,后期的数据类型包括各类timestamp、date、string、int、bigint、char、factor、float等
- 了解数组,以及怎么用(excel的数组挺难用),Python和R也会涉及到 list
- 了解函数和参数,当进阶为编程型的数据分析师时,会让你更快的掌握
- 了解中文编码,UTF8和ASCII,包括CSV的delimiter等
2.第二周:数据可视化
经典图表及展示目的:
https://zhuanlan.zhihu.com/p/24168144
报表制作:
https://zhuanlan.zhihu.com/p/24409555
第一周数据BI实战:
https://zhuanlan.zhihu.com/p/24573880
PPT:http://study.163.com/my
附一张图表建议的思维指南。
3.第三周:分析思维的训练
金字塔原理、麦肯锡思维、SMART、5W2H、SWOT、4P理论、六顶思考帽等框架都是大巧不工的经典。网上搜咨询公司的面试题,搜Case Book。题目用新学的思维导图做,先套那些经典框架,做一遍,然后去看答案对比。
如果这些思维方式都很熟练了,利用以下两篇文章做个温习。
麦肯锡思维:
https://zhuanlan.zhihu.com/p/24773022
数据分析思维框架:
https://zhuanlan.zhihu.com/p/24887013
统计学和数学的基本概念:李航的《统计学习方法》。
4.第四周:数据库学习
数据库入门:
https://zhuanlan.zhihu.com/p/25120684
W3C教程:
http://www.w3school.com.cn/sql/index.asp
SQL是数据分析的核心技能之一,从Excel到SQL是数据处理效率的一大进步,W3C是用下来可读性最高的。学习围绕Select展开。增删改、约束、索引、数据库范式均可以跳过。主要了解where、group by、order by、having、like、count、sum、min、max、distinct、if、join、left join、limit、and和or的逻辑,时间转换函数等。
如果想要跟进一步,可以学习row_number、substr、convert、contact等。另外不同数据平台的函数会有差异,例如Presto和phpMyAdmin。
SQL进阶:https://zhuanlan.zhihu.com/p/25435517
有时间网上刷题,可以根据后续工作提前准备好SQL语句,让熟手帮忙改,而不是直接让别人帮忙写好。
5.第五周:统计知识学习
这一周努力掌握描述性统计,包括均值、中位数、标准差、方差、概率、假设检验、显著性、总体和抽样等概念。详细的数学推导不用细看,只要看到数据,知道不能怎么样,而是应该这样分析即可。
Excel中有一个分析工具库,简单强大。对列1的各名词做到了解。如果是多变量多样本,学会各种检验。
6.第六周:业务学习
主要内容为财务、营销、顾客关系管理、顾客决策流程、用户行为、渠道、线上线下运营。
因为是业务出身,这周的内容我没有学。建议非业务去看目前服务于该客户的供应商产品以及市场上的竞品,了解他们用什么,能摸出来他们关注什么。Demo是很好的资源。
7.第七周:Python学习
编程学习说简单不简单,说难也不难,因为我们是菜鸡,所以学的方向比较单一,不会像廖XX的网站上一样挂出对联那么长的名目。需要学会条件判断、字典、切片、循环、迭代、自定义函数等。知道数据领域最经典的包Pandas+Numpy。
Python入门:《深入浅出Python》,我用的是Anaconda,代码一定要自己写一遍。这部分我的操作和学SQL不一样,是让专家先写了差不多二十段工作当中常用的代码,然后自己按照之前学的基本原理愉快地剪切、复制、粘贴、抄袭。
End.
转载请注明来自36大数据(36dsj.com): 36大数据 » 文科生如何七周内入门数据分析?