知乎披露开源策略:拥抱开源社区,开放数据集

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

由计算机学会主办的 CCF C³ 活动近日走进知乎。知乎合伙人兼 CTO 李大海、搜狗 CEO 王小川、华东师范大学教授王伟在内的企业界、学界技术代表齐聚,带来一场精彩的技术分享盛宴。

围绕「 创业 公司如何拥抱开源」的分享主题,知乎合伙人兼 CTO 李大海首次披露了知乎在开源领域的举措。李大海还为创业公司提出建议:即使不以开源为 商业 模式的公司,也可以通过拥抱开源实现技术进阶和业务增长。

知乎披露开源策略:拥抱开源社区,开放数据集

知乎合伙人兼 CTO 李大海

拥抱开源,拥抱先进生产力

从上个世纪五六十年代,最早的开源软件诞生起,开源已经被广泛应用在 互联网 行业,也被应用到了许多传统行业,甚至银行、电力、通信、教育、能源等关系到国计民生的基础行业。

实践证明,开源不仅仅是一种软件开发方式,更是一种高效的开放协作的生产模式,一种先进的生产力。无论是操作系统、编译器、数据库这三大技术软件领域,还是 AI、硬件领域,开源都已经成为技术开发的主流模式。

对于刚刚起步的创业公司而言,开源也拥有着巨大吸引力。李大海在演讲中明确表示:“任何一个技术公司,都很难在技术选型的时候,坚持不碰开源软件,专门挑闭源的方案来搭建自己的业务。换句话说,不用开源在某些领域就没有好东西可以用了,只能自己从头造轮子。”

华东师范大学教授王伟则从学术角度分析开源的必要性。他认为,人类逐步走向全球化协作的趋势下,开源成为一种先进的协同生产方式。开源可以帮助企业提升组织的生产力、创新力、影响力、竞争力等多方面的能力。

在李大海看来,不是直接通过开源软件来建立商业模式的公司,也能从开源中获得很多的收益,鼓励技术公司都主动参与到开源中来。同时,他还建议创业公司基于企业的现实状况,选择适合自己的开源参与方式。

知乎:从发起开源项目到拥抱开源社区

作为中文互联网最大的在线问答社区,知乎以问答模式著称,业务围绕“让人们更好地分享知识、经验和见解,找到自己的解答”的使命展开,与开源的价值观高度相符。

知乎一直坚定地主动拥抱开源,技术演进同样离不开开源。截至目前,开源在知乎已经覆盖了操作系统、存储,资源编排系统,微服务网格等基础设施, 以及 AI、移动端开发等各种业务层的应用。“可以说,整个知乎的技术栈都是建立在开源项目的基础上的,知乎的高速发展离不开开源的基石支撑。”李大海表示。

知乎参与开源可分为三个方向。第一个方向是主动发起开源项目,包括 Rucene、SERank、cuBert 等基础软件项目,以及 Web 端视频播放器、Android 端图片选择器等大前端项目。

第二个方向是参与开源社区项目。比如数据库领域的 TiDB 社区、消息系统领域的 Pulsar 社区、计算引擎领域的 Flink 社区以及微服务网格领域的 Istio 和 Envoy 社区。

第三个方向是开源数据集。知乎联合清华开放了基于知乎的大规模富文本查询和推荐数据集「ZhihuRec」,包含了知乎上的1亿个行为数据,可以说是目前为止,国内用于个性化推荐的最大的实际交互数据集。此外,知乎还联合北京智源人工智能研究院开放了接近 200 万用户和 1000 万邀请数据的 Link prediction 大型数据集。目前,知乎还在与 PingCAP 共同推进内容社区开放数据库性能测试标准。

未来,知乎还将持续强化开源投入,其中包括成立开源项目办公室,通过人力与运营手段,紧密拥抱社区,更高效地回馈社区并建立自己的技术影响力。

随意打赏

提交建议
微信扫一扫,分享给好友吧。