最受欢迎的语言仍然是R( KDnuggets 读者中有61%用户在用),python(39%),SQL(37%).SAS仍然稳定在20%之间。 增长最快是:Pig/Hive/Hadoop为基础的语言、R、SQL,同时perl, C/C++, 与Unix 在下降。同时我们发现,R与python用户存在一定的重叠 。
之前的KDnuggets的调查主要是关注:
统计与分析软件,但有时候一个全面与强大的编程语言是需要的。
这也是最近一次的KDnuggets调查关注的重点,我们咨询:
在2013年中,什么样的程序或者统计语言你是在做分析、挖掘、科学计算的时候所需要的?
基于超过对700名会员的调查,
最受欢迎的仍然是R语言(61%的调研会员在用),python(39%),SQL(37%),平均每个调研对象使用2.3种语言
。
趋势对比过去二年的调查结果,发现2013的趋势是一样的:
- 2012年调查:什么样的语言可用于 数据分析 与数据挖掘。
- 2011年调查:什么样的语言可用于数据分析与数据挖掘。
· 增长率最高的语言,对比2013 vs 2012是Julia,使用人员增加超过2倍。但仍然是一门小众语言,在2013年也仅有0,7%的用户使用。
· 在比较普通的使用语言中:增加相对较大的语言,对比 2013 vs 2012:
· 以hadoop为基础的语言:Pig Latin/Hive/other,19%的环比增长,从2012年的6.7%增加到2013。
· R,16%的环比增长。
· SQL,14%的增长(SQL的增长是的来源于Hadoop和其它的大数据系统中的SQL接口增长)。
语言的使用份额下降最大的是:
- Lisp/Clojure, 77% 下降
- Perl, 50% 下降
- Ruby, 41% 下降
- C/C++, 35% 下降
- Unix shell/awk/sed, 25% 下降
- Java, 22% 下降
R与PYTHON的使用者是否有重合呢?是的。在使用R语言的13%的用户中,更可能使用python与总体相比要高出13%。下面是哪些语言更可能被R语言用户使用(与总体相比)。
评论:
有一些评论说,比如:指出SPSS也是自己的语法和SAS一样–在下次的调研中,我们将会包括进来。
样本的区域分布为:
- US/Canada, 50.8%,
- Europe: 25.7%,
- Asia: 11.8%,
- Latin America: 6.7%,
- AU/NZ: 3.2%,
- Africa/Middle East: 1.5%
注:本文来自 中国统计网翻译小组 ——@数据海洋 编译
英文原文:
Top Languages for analytics, data mining, data science
自:中国统计网