译荐:关于数据科学的顶尖网络课程top10
36大数据专稿,原文作者:Manu Jeevan, 本文由36大数据翻译组-JOKER/se翻译向36大数据投稿,并授权36大数据独家发布。转载必须获得本站及作者的同意,拒绝任何不标明作者及来源的转载。
随着大数据技术逐步简化了人们的日常工作与社会行为,在过去的几年里,各个行业对于数据科学家的需求已经有了明显的增加。全球的企业都在试图争取到具备数据科学技能的精英们,并且愿意为之付出大量的资金以确保这些疯狂的数据工作者得到他们应得的报酬。专家们一致认为数据科学仍处于起步阶段,它很快会成为一个及其普遍的学科。如果你想了解数据科学并成为一名数据科学专家,可以看看本文的课程评价
1)哈佛大学数据科学课程
该课程是综合类的数据科学概念,如机器学习,可视化,数据挖掘,编程,数据改写等。在整个课程中你将使用流行的Python库如numpy,SciPy,Scikit-learn,Pandas 。我建议你在学习此课程前先完成coursera机器学习课程,机器学习课程包括了PCA(降维),K-means和不包含深度的逻辑回归。但请记住,你必须投入大量的时间来完成这个过程,尤其是作业练习将非常具有挑战性。
如果你擅长统计和编程可以选择这个课程。 2014年版本的哈佛数据科学课程。你可以在这里访问的演讲视频( http://cs109.github.io/2014/ )。
前提要求 :CS50和统计100
编程语言 :Python
课程长度 :3个月
难度 :非常高
教师 :Hanspeter Pfister 和 Joe Blizsten
别人的评论:
Vincent granvelli写了关于这门课程的详细评论。
cs109学到什么 – Quora
Ms. Natalia写了这个课程评论。
2)分析边缘
本课程给R语言提供了一个很好的介绍,同时也给予了一些统计建模技术的经验。该课程运用了真实世界的例子说明了如何运用分析技术使提高企业或行业得到显著的提升 。工作量非常大,但讲座和习题集有着非常合理的安排和结构。如果您有兴趣学习一些实用的分析方法,但又不希望去了解庞杂的数学背景,这个课程非常适合你。
前提要求:数学的基本知识
编程语言:R,Libre office/Excel
课程长度:11周
难度:高
教师:Dimitris Bertsimas 和 Allison Kelly O’Hair
别人的评论:课程讲座
3)Coursera机器学习课程
数据科学和机器学习是密切相关的。除了机器学习,该课程还向您介绍了如何处理高维数据(PCA),介绍了MapReduce,偏见VS差异,学习曲线等。课程采用了Octave(替代MATLAB),将有一套视频向您展示如何使用Octave。学习这门课程之前,最好是有一些积分的知识,因此可以考虑先学习MIT的多变量微积分课程。
前提要求:基本线性代数和微积分
编程语言:Octave
课程长度:10周
难度:低
教师:Andrew Ng
该课程是由Udacity和AT&T提供的一个微学位,你可以通过$ 200 /每月一共6-12个月(10-20小时/周)去得到一个网上认证。 Udacity的数据科学教授R语言,Python,MongoDB和Hadoop。课程涵盖理论和数据科学的实践,并且在课程结束时会有一个项目让你运用你所学到的知识。该项目可以是被视作你的工作成绩与他人,尤其是招聘人员分享。这门课程的前提要求是相当高的,你学习这门课程之前需要各种技能。
前提要求:描述统计,推论统计,数据争论,R,机器学习,数据可视化,数据科学基础知识,计算机科学基础知识。
课程长度:12个月(10小时/周)
难度:非常高
教师:Chen Hang Lee 和 Miriam Swords Kalk
5)计算思维和数据科学导论
本课程简要的介绍了策划,随机程序,概率统计,随机游走,蒙特卡罗模拟,数据建模,问题优化和集群。即使你只有一点编程经验,你也可以从这个课程中学到很多东西。该课程是Python和数据科学初学者的启蒙课程。
前提要求:介绍计算机科学和Python编程
编程语言:Python
课程长度:9周(12小时/周)
难度:中级
教师:John Guttag, Eric Grimson, Ana Bell
课程相关评论:Mooctivity
6)Coursera介绍到数据科学课程
这个课程广泛介绍了数据科学的各种概念。第一个程序练习“Python下的推特情感分析”是非常具有挑战性的,而且只分配了非常少的时间。Bill Howe教授已经假定您了解统计数据,Python和SQL了,你真的需要知道它们,因为课程中并不会教授很多相关知识。在学习此课程之前,通过斯坦福的数据库课程,从代码学院学习Python编程概念,学习基本的统计和机器学习的基础知识。不要指望这门课程会向您介绍这些概念。这门课解释了很多关于关系数据库,Map Reduce 和 No -sql。该课程并不适合初学者。
前提条件:Python,统计,数据库基本知识基础。
教师:Bill Howe
编程语言:Python和R
长度:3个月
难度:中等
评论有关课程:课程讲座和Quora
7)Johns Hopkinson 数据科学课程
R语言是探索数据分析和清理数据模块非常好的教程和实践。统计推断和回归模型结构模块并没有很合理的安排;他们有太多新的资料需要初学者学习。数据科学家的工具箱模块就是在浪费时间;你可以在这里看关于这个模块的评论:数据科学工具盒。
用项目漩涡来学习R语言非常值得玩味。大多数的时间教授仅仅就是读幻灯片,不添加任何附加信息。某些概念也没有解释清楚,所以你会花更多的时间使用Google来学习这些概念。这是对于统计来说太传统,太沉重。
前提要求:工作的数学知识达代数和一些编程知识。
教师: Brian Caffo
编程语言:R
长度:12个月
难度:中级
评论有关课程:科技供电数学
8)基础数据分析
本课程的重点是统计学并且提供了一些R语言中描述和推断统计概念的经验,如果你想学习R和统计概念,那么这个是最适合你的。您将利用一个良好的格式化的数据集来工作,这样你就不需要学习数据改写。在这个课程结束时,你会使用不同的统计方法在R语言里解决自己的相关数据问题。
前提要求:无
教师:Micheal J. Mahometa
编程语言:R
长度:13周(3-6小时/周)
难度:中级
评论有关课程:课程讲座
9)数据科学在行动
本课程基于Wil van der Aals教授的“挖掘过程”一书。如果你是一个商务人士,不具备编程经验,那么这个课程是最适合你的。本课程是一个经典的“商界”与“IT”之间沟通的桥梁。该课程采用很多真实世界的事件日志来作为说明这些概念和算法的例子。经过这一过程,你将能够运行进程挖掘项目,并对商务流程智能领域有很好的理解。
前提要求:对逻辑,集,统计有一个基本的了解(本科阶段)。
教师:Wil Van Der Aalst
编程语言/工具:ProM, Disco, Rapid Miner
长度:13周(3-6小时/周)
难度:容易
10)挖掘大量数据集
该课程将为您介绍基本的算法和技术来处理大数据,如MapReduce, Locality Sensitive Hashing,页面排名,以及大型图形和数据流算法。它会教你如何将这些工具包运用于重要的实际应用,如网页搜索,推荐系统和在线广告。本课程对于降维方面的学习将非常重视。此课程将免费提供一本基于课程的教课书。本课程期望你有数据库和算法方面的良好的知识。
前提要求:算法,数据结构和数据库的基础课程
教师:Jure Leskovec, Anand Rajaraman, Jeff Ulman
编程语言特点/工具:SQL
长度:6周
难度:中级
评论关于课程:Quora
结论:
这些即将到来的数据分析课程包括了数据分析的计算方法,数据分析和统计推断,编码矩阵。Data camp是学习R语言的一个好地方。如果你想利用Python进行数据分析,你可以多多关注我的文章。
原文标题:Review of top 10 online Data Science courses
End.