汪源做客阿里云大咖说,论道数据库开源与存储生态
汪源:解决“卡脖子”问题,开源更容易成功
开源对于生态对接的重要性是什么?
开源生态建设对于To B客户的意义在哪里?
开源是否是实现国产化替代的合适路径?
近日,网易副总裁、杭州研究院执行院长、网易数帆总经理汪源受邀参加阿里云“大咖说*对话开源”,与阿里云数据库开源战役负责人、阿里云智能数据库产品事业部架构组负责人曲山(黄贵)展开精彩对话,以Data Infra(数据基础设施)为例,就开源生态、 商业 化及国产化等一系列问题进行了深入探讨。
Curve 开源存储,意在全场景支持
汪源是资深的开源技术实践者,2006年,初到网易的他面对业务增长带来的挑战,采用分库分表的方案推进开源MySQL对Oracle的替代。这比后来影响巨大的“去IOE”行动还要早,而这套技术现在依然运行良好。
汪源介绍,网易开源之路可以分为用好开源、增强回馈、自主开源这三步,即首先充分利用开源技术发挥价值,而后将对其不完善之处的增强贡献给社区,最后是将自研项目开源,解决已有技术架构力不能及的问题。
开源云原生软件定义存储系统Curve就是第三步的产出,是网易数帆突破开源存储性能瓶颈的努力,也是网易数帆和阿里云在数据库领域合作,为开源PolarDB for PostgreSQL提供分布式共享存储的主角。曲山表示,稳定性、可靠性和可用性这些是存储的基本需求,数据库业务有更高的要求,如对一写多读的架构,要支持多点挂载、闪回查询等能力,PolarDB for PostgreSQL和Curve 完成了对接。
Curve的目标,是打造一个高性能、易运维、全场景支持的通用存储系统,包括支持PostgreSQL、MySQL等多种云原生数据库,包括在块存储之外还提供文件存储,汪源认为,这将使得整个技术栈能够发挥更好的效益。
开源是基础软件成功的必要条件
在目前的基础软件领域,尤其是Data Infra,开源越来越流行,汪源认为,开源是成功的必要条件,以Curve为例,要想和Ceph分庭抗礼,不开源是不行的。
曲山同样认为,开源是打造行业标杆产品的必选项。曲山表示,商业产品获得客户需要付出比较高昂的成本,只有做到开放才能跟各种生态去对接。
曲山解释说,开源软件采用开放的标准的接口,对于打通生态实现基础软件构架体系一体化很重要,如PolarDB和Curve等开源软件的对接都是基于标准的接口,在实践中并不需要耗费很多精力。
To B技术需要通盘考虑技术生态位
网易数帆的开源实践,始于服务网易业务,星辰大海却在To B市场,通过网易数帆为更多客户提供服务。汪源表示,这需要每一项技术通盘考虑能否与上下游构成一个健康的技术生态链,动态地发展,不断提升和改进,每一层都有多重技术选项和多个服务商来提供产品,最后组成一个很好的解决方案给客户。
良好的技术生态意味着要有一个繁荣的社区,有不同行业和企业的贡献者,而不是只有一家公司唱独角戏,从而为企业有效分散供应链的风险。
那么,软件开源了,是否影响商业化的推进?汪源和曲山都认为,如数据库这样的复杂的基础软件产品,真正在工业级场景下大规模应用,企业是需要专业团队来提供技术保障的。
汪源表示,专心做好产品,把客户基础做得足够大,生意自然能做大,“不用着急,至少在你的开源项目没有达到一定的状态之前,不用过早地去关注这个事情。”
曲山表示,通过云服务把已经验证过的产品开放出去,也是一条较好的商业化途径,如Databricks、Snowflake就是典型的例子。
解决卡脖子问题,开源比闭源成长更好
在今天基础软件国产化替代、解决卡脖子问题的趋势下,开源模式获得了空前的关注,但开源真的比传统的闭源研发模式更有优势吗?
在2003年就参与研发国产数据库神舟OSCAR的汪源对此深有感触。他表示,神舟OSCAR当年在 科技 部测评中得分远超第二名,但到今天看来发展得不甚理想。虽然国内的开源数据库和Spark、Snowflake等Data Infra技术相比体量仍然差距巨大,也不能说特别成功,但对比非开源国产数据库和现在开源的国产数据库最初三五年的发展,汪源认为开源更胜一筹。
“还是能够明显地看出来,开源数据库至少前期的成长过程,比原来非开源的(数据库)要高很多,用开源的方式去做,成功的概率会更大。”汪源说。