以自由计算为基,青云科技探索AI Cloud新路径
青云 科技 从诞生之日起就提出“云之基石,自由计算”的理念,希望“把自由留给客户,把复杂交给自己”,从客户需求出发,成为企业数字化转型的基石。
闻道有先后,术业有专攻。在服务行业数字化转型的进程中,青云科技最擅长做的是为企业提供底层的、基础的、复杂的技术、产品和解决方案,并且致力于与合作伙伴一起服务最终客户。
青云科技和整个行业一样,都是从通用云计算开始,然后在虚拟化、计算、存储、网络以及资源分发上做了大量工作。目前,在HPC领域和AI智算领域,青云科技的产品越来越面向终端用户,并且有越来越多的政府、科研、企业等机构用户使用青云科技的平台产品。从市场角度上看,有产品,就要有相应的服务让其推而广之。此时,在AI算力调度平台的基础上,青云科技思考的是如何联合合作伙伴,为最终用户提供一个完整的解决方案。基于这样的需求,青云科技AI算力云服务应运而生。“青云科技AI算力云服务的定位是一个开放的生态同盟,所以青云在集结这些跟我们志同道合的合作伙伴,通过‘同盟’的方式一起运营AI算力云服务。”青云科技CEO林源说道。目前,青云科技在AI算力云“同盟”建设上,包括英伟达、AMD以及国产芯片厂商等AI算力组件生态,商汤、无问芯穹、紫东太初等AI算力模型生态,清华大学电子工程系智算中心等AI算力服务生态以及 金融 、制造、交通、能源等AI算力场景生态。
青云科技在AI算力的逻辑和思路是希望依托一个开放的、成熟的、可运营的AI智算平台,通过自营、合营乃至支撑第三方运营的方式,与生态同盟一起贡献AI Cloud。在这一过程中,青云科技并不是什么都干,而是聚焦于自己最擅长的技术领域,这恰恰是青云科技的差异化价值所在。
同时,用户的算力部署环境和业务形态也将呈现多元化的趋势:在算力方面,既包括传统云计算(以CPU为主)、智算(以GPU为主)、超算(以HPC为主)等多元算力,还包括国外芯片及国内芯片等异构算力;在业务形态方面,既有成本敏感型业务,也有延迟敏感型业务。这不仅会使得应用部署变得更复杂,也对技术和平台提出了更高的要求。
“智算中心 投资 巨大,能否盈利取决于运营效率和平台能力。因为平台能力越强,能支撑的用户业务类型就越多,盈利模式也就越清晰。以国家超算济南中心为例,该中心依托于青云AI智算平台,实现了底层架构、中间PaaS平台以及上层应用之间的算力存储、调度及运维,而凭借多元异构的算力平台以及信创适配能力,使该中心能够支撑科学计算、政务云建设以及智慧城市建设等多种业务类型,从而大幅提升了中心的运营和盈利能力。”林源如此说道。事实上,国家超算济南中心所构建的算力调度平台,正是青云科技经过持续的技术积累、沉淀以及市场实践之后,所推出的计算中心运营工具。
具体来看,青云AI智算平台,在分布式调度和管理上,基于就近使用的原则,能够在最靠近数据的节点上承载业务,并保障所有节点服务体验一致;在资源调度上,能够立即调度扩容数万卡资源、设置最短优先调度链路、支持异构平台、提升感知作业级单卡颗粒度等;在高速并行存储上,能够构建统一的数据存储底座,实施数据生命周期分层策略,降低存储成本。