SAS学习途径与相关资源 – SAS商业分析
SAS可能是分析行业最常用的工具了。与其他工具比如R和Python相比,尽管有人可能对它的可持续性以及特征有着不同的想法,但是有两点是可以肯定的。那就是:
健康的市场份额 – SAS仍然占据着最大的市场份额。哪怕是在像美国和英国这样的高级市场,它的市场份额至少有40%。而像印度这样的国家,它的市场份额会超过70%。
便于学习并且有着超棒的(资源)支持 – 在我所知道的工具中,SAS有资格被认为是最简单易学的。语言简单到连新手都能快速入门。
这两个理由足够让刚刚进入这个行业的新手考虑学习SAS。点击这个链接,http://www.analyticsvidhya.com/blog/2014/03/sas-vs-vs-python-tool-learn/ 你可以找到更多相关细节。
首先,为什么要学习SAS?
点击此链接,https://www.youtube.com/watch?v=ksp8CzIgb-E,有一个小视频可以让你了解一下学习SAS的用途。
第一步:下载并安装SAS软件
可以通过创建一个SAS文件来下载学校版本。你也需要下载VMWare或者Oracle 视图工具箱。学校版本链接如下:http://www.sas.com/en_us/software/university-edition.html。
安装提示:
SAS学校版本目前只支持windows 64bit系统
你需要先下载VMWare播放器或者Oracle视图工具箱,然后下载相应的SAS大学版本。
第二步:学习基本SAS
在sad.com有免费的基础SAS培训,通过这个培训你可以在24小时内学习到SAS的基础知识。
第三步:学习SQL
现在你在一定程度上了解了SAS基础知识,现在你应该看一下另一种在SAS上处理数据的方式- PROC SQL。阅读这篇文章可以帮助你理解PROC SQL如何用于处理数据。(Proc SQL和Data Step之间的比较)
如果你已经知道了SQL,你会感激SAS创建了PROC SQL。即使你不知道SQL,你可能也会觉得在SAS上进行日常数据管理工作很简单。这篇SUGI文章也可以看一看:PROC SQL入门。如果你需要更细致的教程,可以看看这个学习工具:http://www.sys-seminar.com/EE/Files/AdvancedSubqueriesinPROCSQL.pdf
第四步:学习描述统计学
现在让我们开始统计学的学习。现在可以开始学习描述统计学的课程了(链接https://www.udacity.com/course/ud827)。这门课程用Excel来教你所以描述统计学的基础知识。如果你已经知道这些知识,可以直接略过这一步。
课程任务:在Udacity课程的每个章节后面的习题应该在SAS上完成。从基础SAS课程学到的知识应该足够让你完成这些习题。如果你需要具体的帮助,可以使用SAS文档。
第五步:学习推理统计学
这个链接是学习推理统计学的课程(https://www.udacity.com/course/ud201)。这个课程使用Excel表格教你所有关于推理统计学,假设性检测,T-检测以及ANOVA的相关知识。如果你已经学过这些知识,可以直接略过这一步。
课程任务:在Udacity课程的每个章节后面的习题应该在Excel上完成。在下一步完成后,我们将重新温习一下SAS课程。
第六步:在SAS学习ANOVA,线性回归和逻辑回归分析
sas.com上有相关培训内容(链接:https://support.sas.com/edu/schedules.html?id=1979&ctry=US)
课程任务:课程里以及Udacity课程里都有有相关习题
如果你使用的是SAS大学版本,你需要略过步骤7.9和10。 SAS大学版本有版本限制,不能运行决策树和时间序列建模。
第七步:学习决策树
既然你知道了一些算法,那就让我们看看决策树。这里有两篇解释决策树运行的相关文章:
决策树 – 简化版本http://www.analyticsvidhya.com/blog/2015/01/decision-tree-simplified/
决策树算法 – 简化版本http://www.analyticsvidhya.com/blog/?p=12419&preview=true
这里有一份指导如何在Enterprise Miner上运行决策树的指南 http://www.iasri.res.in/sscnars/data_mining/3-Building%20Decision%20Trees%20using%20SAS.pdf。
这个是一篇关于在基础SAS上执行决策树的文章http://support.sas.com/resources/papers/proceedings10/094-2010.pdf。
第八步:分类归并与分段
首先,先看看播放列表中前四个介绍K-平均值分类归并的视频https://www.youtube.com/watch?v=aiJ8II94qck&list=PLQbGGI2mvVjPPvWgs4hCR5FkXykzAu69S。然后读一下从SAS上分类归并的指南http://support.sas.com/documentation/cdl/en/statugclustering/61759/PDF/default/statugclustering.pdf。此外,你可以在这个章节查询相关内容 http://www.math.wpi.edu/saspdf/stat/chap23.pdf。
第九步:学习时间序列预测
这个链接是学习时间序列预测的入门教程。你可以使用这个教程来使用SAS里的时间序列来预测。
第十步:学习IML
以下三个链接是一系列的文章。你可以通过这些文章快速了解IML:
SAS IML介绍http://www.analyticsvidhya.com/blog/2014/10/proc-iml-matrix-handling-sas/
PROC IML世界的将来发展http://www.analyticsvidhya.com/blog/2014/11/step-world-sas-iml/
PROC IML在分析中的应用 http://www.analyticsvidhya.com/blog/2014/11/applications-sas-iml-analytics/
第十一步:学习SAS Macros
下面三个链接是一系列帮助你理解SAS Macros的文章。
SAL Macro入门介绍
SAS Macro条件语句和迭代语句
SAS Macro功能介绍
其他关于SAS的有用资源:
SAS小手册
ATS UCLA的学习之路
数据分析例子 – SAS具体话题实例
——本文由数据分析网翻译组- 纪旭翻译
首发:http://www.afenxi.com/post/22536