Github 年度开源报告:TensorFlow 成最受欢迎深度学习项目
1 新智元原创
来源:octoverse.github.com
作者:文强
【新智元导读】 Github 日前发布了 2016 年度的《Octoverse 观察报告》,对开源和社区做了统计,与人工智能开源运动相比,得到一些有趣的结果:印象中的“开源大户”谷歌并不是开源项目最多的公司(答案请见内文),但发布不到两年的 TensorFlow 已登上最受欢迎 repos 榜单。AI 巨头中,贡献者最多的项目属于 Facebook,微软紧随其后,但贡献者还是出自微软的人数最多;全球 Github 新增用户中,中国表现突出,增长率高达 97%。
TensorFlow 是最受欢迎的开源项目
从让阿波罗 11 号登月的代码到帮助非盈利组织的开源课程,过去一年中,GitHub 上涌现了一大批开源项目。以下是最受欢迎(得到星标最多)的项目:
由上图可见,TensorFlow 是唯一上榜的深度学习库,可见其近 12 个月来的传播程度,也从另一个侧面表明,谷歌的宣传能力或者说号召能力成效显著。当然,深度学习也确实随着开源逐渐流行,谷歌和 TensorFlow 的贡献很多。
最受欢迎的编程语言
GitHub 开源项目一共使用了 316 种不同的编程语言,其中根据过去一年提交的 Pull Request(用于向项目提交补丁,反映项目热度及受欢迎程度)使用最多的前 15 种编程语言如下。
其中,最受欢迎的编程语言是 Java,超出第二名 Java 一倍多。作为深度学习最常用语言的 Phython 位居第三。
新智元此前曾经报道过 谷歌工程师最爱用的 10 种编程语言 :
-
Java
-
C/C++
-
Go
-
Python
-
Type
-
Dart
-
PHP
-
Objective-C
-
C#
对照来看,谷歌工程师最爱用的也是 Java,自家的产品 Go 当然也排名靠前。
Github 贡献者最活跃的项目
贡献对项目推送了代码、对打开或评论了问题,或者提交 Pull Request。活跃则表示有过代码提交、写备注、被星标和问题汇报 issue 等行为。
据统计,过去一年来,Github 有 580 万以上的活跃用户、33 万以上的活跃组织、1.9 亿以上的活跃项目,以及 1000 万以上的活跃问题汇报。
其中,按照项目贡献者活跃度排名:
贡献者人数最多的机构
贡献者人数最多的机构,微软位居第一。
当然,贡献者人数与公司员工数量有一定关系,微软全球员工加起来超过 Facebook 员工总数的 10 倍还要多,因此,Github 这个排名实际上凸显了 Facebook 人的活跃。
相比之下,谷歌的排名就有些不太好说了……难道都去做自家公司的项目了?
Fork 最多的项目
Fork 越多,代表对这个项目感兴趣、有可能会参与开发的人越多。
在这里,TensorFlow 再次展现实力――虽然排名第五,要知道,排名第一的 datasharing 是一篇文章,排名第二的 Spoon-Knife 和第三的 ProgrammingAssignment2 都是教程。
可以说,TensorFlow 名副其实是 Github 深度学习开源第一库。这么看来,微软的 CNTK 或需加强宣传力度。
Github 新增用户中国排名第一
GitHub 上已经有超过 520 万的用户和超 30 万的机构。过去一年来,有超过 81 万人首次提交 Pull Request,有 280 万人创造了自己的第一个项目。
其中,中国是新用户注册增长最多的国家,同比增长 97%,由此可见 GitHub 在中国的接受度大幅提高。
全球进入协同编程时代
由上图可以见,绝大部分 PR 都是由机构发起的,说明全球正进入大规模协同编程时代。这与从 2015 年底开始的深度学习开源运动潮流相符。
报告原文地址:https://octoverse.github.com/
点击阅读原文,观看2016世界人工智能大会主论坛全程回顾视频