从深度学习开源平台谈互联网开源史
近日,百度深度学习研究院(IDL)、微软亚洲研究院、华盛顿大学、纽约大学、香港科技大学,卡耐基·梅陇大学等知名公司和高校联手在知名开源网站GITHUB上建立了分布式深度机器学习开源平台( http://chengzhe.baijia.baidu.com/article/https://dmlc.github.io/) ,该组织叫做“深盟”,向全世界的分布式机器系统学习的学习者提供一个很好的开源平台,让更多企业受益。而这一开源项目也让我去重新思考整个互联网的开源逻辑,以及开源运动所带来的积极意义。在我看来互联网的代码开源分为两类,一类是无组织式的开源项目,另一类则是有组织式的开源项目。
一,无组织式的开源项目
所谓无组织式的开源项目,指的是某个程序项目被其作者公开源码,这些源码被放到诸如国外GITHUB,国内CSDN这样的开源平台上面,让大家学习与分享。程序作者非常享受自己代码被其他程序员应用的过程,而其他程序员也可以直接从源码中找到自己需要的部分,将其直接迁移到自己的项目中,再通过学习掌握某个模块的技能,这大大节省了自己独立学习的时间。
所以无组织式的开源是程序员们自由交流的结果,不存在明确的分工协作,同样不存在太高的商业价值,但是意义在于推动了程序员们的整体水平。
而GITHUB这样的平台很好的满足了这样的交流需求。
二,有组织式的开源项目
所谓有组织式的开源项目,指的是某个开源项目有一个组织在支撑,一直在不断升级源代码,让项目源码更强大更好用。
从另一个角度来说,一个组织不会凭空建立,组织是人类最基本的分工协作方式,而一个组织的存在则一定意味着社会某处存在需要被解决的需求,而组织就是为了这些需求而生。互联网的开源运动则是一场现代的乌托邦的运动,很多开源项目组织没有依靠利益而是依靠理想建立了起来。
最著名的开源项目当然就是linux,linux是一个类似windows的操作系统,基于其开源内核,被开发出了各种linux操作系统版本,诸如小红帽、ubuntu、debian以及国内的红旗等等,但是由于windows的崛起,个人PC系统被微软垄断,导致了各个优秀的linux个人操作系统都集体走向没落。
而linux在PC操作系统上的没落也是业内探讨最多的,封闭与开放到底哪一个更符合互联网的精神?曾经的自由乌托邦为何会在商业化的竞争下面集体衰落?封闭的IOS与开放的Andriod的战争又是谁会获胜?
在我看来,开放与封闭都并非万能,各有优劣,但要想赢得最终的胜利,不是取决于某种精神理念,也不是取决于某种商业模式,最终一切还是取决某个项目在具体的使用场景下是否能够更好的满足用户的需求,这才是一切的核心。
当然,有组织式的开源模式,还是有一定盈利方法,例如投放广告,为有需求的厂家提供具体开发服务和商业咨询等等,当然很多开源组织赚到的钱都只是为了维持组织正常运行而已。
三,有组织式的开源项目的价值
有组织式的开源项目的意义不仅仅在于建造了一个个带有理想主义色彩的乌托邦组织,更重要的是这些组织建造了互联网的基础设施,可以说,世界上任何一个接入互联网的人都离不开这些开源项目的服务。这些开源项目的意义可以看成是造纸术以及印刷术的发明,技术发明者不会因为技术的发明受益太多,但是为整个人类文明带来的贡献则是巨大的。
从互联网的发展,来盘点一下几个极为重要的开源项目。
1,web开源项目
1995年人们开始大量访问互联网,而曾经的静态网页已经越来越无法满足用户的需求,所以需要呈现更多的内容,于是更多的网站开始转变为动态,需要与数据库交互,所以PHP开源项目诞生了,PHP程序语言可以让程序员们编写相应的代码,实现web网页与数据库的交互。
而与此同时,其他公司也看到了未来的商业化机遇,微软也同时推出了ASP,SUN公司将面向嵌入式开发的OAK改名为JAVA,并面向WEB端……
当然,最后微软和SUN等公司也拿下了web编程语言的市场份额,但是类似PHP的开源技术更受到初创公司和小企业的青睐,尤其是互联网公司都更倾向于开源技术,因为没有一个公司愿意把命运放到其他公司手中,所以扎克伯格用PHP创造了FaceBook,拉里佩奇用PHP创造了谷歌,李彦宏用PHP创造了百度(当然这些公司都不止用到这一种语言)……
所以PHP开源技术对整个互联网的贡献极为巨大。
2,服务器开源项目
同时,互联网发展后用户增多了,网站也增多了,那么也就自然需要服务器处理的相关技术。在服务器系统层面,有两个主要选择,一个是选择Linux另一个式选择微软的Windows Server。而很多企业则在Linux上看到了商机,通过对Linux或其前身Unix进行改造,写出服务器系统。
因为Windows是需要收费,而Linux绝大多数是免费,所以很多开发者选择了Linux系统作为服务器,而目前全球绝大多数服务器系统都是Linux内核所研发的。
接着是服务器软件,这里就说一个开源软件— Apache,Apache是一个可以让网站运行的软件,简单的说,服务器上装上这个软件就可以让用户访问你的网站。而Apache开源软件占领了世界上60%的服务器,亚马逊,雅虎,W3C这些大名鼎鼎的网站,都是依靠Apache二次改造运行。
3 ,下一个开源项目的大机会在哪?
PHP,Linux,Apahce这些开源项目构成了互联网底层的水和电,互联网时代从PC时代过渡到移动时代,这些开源项目的价值没有没落反而越发凸显。那么类似的下一个机会在哪?
那就是大数据,未来无论用户是PC端还是移动端,他们的数据都会越来越多的上传到云端产生大数据,而任何拥有这些大数据的企业都必将在这些数据中寻找更大的商业价值,那么无论如何也离不开数据挖掘,也就是机器学习,通过机器深度学习找到数据中的价值。
所以此次百度联合这些公司高校发布的深度开源学习平台很有可能产生出大数据时代的水和电,让更多公司可以进行独立的深度学习,找到大数据中蕴藏着的价值。而从历史角度来看,“深盟”组织的运行模式也很之前的开源项目运行模式一致,相信能为未来创造更多价值。此外百度作为“深盟”重要参与成员,也是国内互联网公司有史以来第一次亲自加入到开源运动中,是一个非常好的开头,同时也希望更多国内互联网公司能够加入类似的开源项目中,展现出国内互联网公司的国际化格局。
结语:
回顾历史,互联网开源运动并非与商业冲突,有组织的开源项目依然能够找到商业上的盈利方式让自己生存,其次正由于这些组织的开源项目建造了底层设施,才能有更多的商业奇迹在此之上诞生出来。
关注人文与科技,我的微信公众号:shouxifayanzhe