聚焦智算新时代| 青云科技:智算中心建设、运营两不误
今年全国两会的《政府工作报告》首次提出“人工智能+”行动。打造以人工智能为引擎的新质生产力,已经成为当前最紧迫的任务。
为人工智能落地应用提供支撑的智算中心正在全国范围内快速兴起。智算中心与云计算中心有何区别?智算中心如何建设,又如何运营和运维?智算中心如何助力新质生产力的打造?为解答这些问题,我们邀请了业界知名厂商、专家,在“智算雄起”的大潮下,各抒己见、观点碰撞,希望为推动智算中心的建设和发展提供有益的借鉴和参考。
青云 科技 认为,如果按照通用算力、智算、超算(高性能计算)这样的算力划分来看算力中心的划分,那么智算中心的定义就相对有点儿窄了,即提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施。但如果将智算中心看做是为智能时代的全部应用提供服务的话,那么这个智算中心就应该是包括了应用所需的算力、存力、运力、数据服务和算法服务等所有资源在内的新型基础设施。这些资源可能还会包括边缘计算。因此,智算中心也应该是打破地域限制的。
从这个维度来看,智算中心必然能提供多元算力,支持异构硬件,架构开放,生态友好,再加上大的行业发展趋势,还要具有绿色安全的特征,最好提供的是普惠服务,这样才有利于产业聚集。
云数据中心被普遍认为是在数据中心的物理基础设施上,采用虚拟化等云计算技术,提供传统的数据中心业务和各种新型网络应用服务。根据上文的分析可以看出,智算中心包括了云数据中心提供的服务与能力之外,还提供了更多元的能力。
青云科技目前没有自建智算中心的打算。青云科技推出AI智算平台,主要是为了帮助客户建设和运营智算中心。
青云科技为智算中心提供的AI智算平台是管理、运营、运维智简的完整且成熟的软件平台,通过将GPU算力、AI算法开发、模型推理与AI基础设施的管理、任务分配结合起来,实现了对多样异构算力的支持、分布式训练任务的调度与管理、模型市场和模型推理、混合组网,从而具备了一站式AI智算全流程服务能力。青云科技同时积极与业务生态合作伙伴深度合作,实现了对多种国产化GPU设备的适配,多种算力加速了平台的集成和整合。青云科技还在将多个 商业 和开源的模型在模型市场适配的基础上,推出了模型推理服务,从而推动AI智算场景的普及和落地。另外,青云科技AI算力云还与相当数量的智算中心合作,提供面向人工智能场景的资源与服务。
据悉,国家超级计算济南中心已经成功地在青云AI智算平台的技术能力支撑下,通过一个超级计算平台,统一管理高性能计算、云计算、人工智能计算、数据存储备份、工业仿真计算等资源模块,纳管异构算力,运营多元算力,服务于科研计算应用、政务云应用、智慧城市应用等多元化业务。2019年,作为当时全亚洲最大的计算中心之一,国家超算济南中心拥有1000P的算力、超300PB的存储,打造的算力服务包括HPC超算、传统云计算(以CPU为主)、智算(兼顾国外及国产GPU),是一个名副其实的多元、异构的算力中心。如今,国家超算济南中心已稳定运营3年,并已开始盈利。
从目前来看,智算中心的落地还面临一些挑战。一方面,智算中心 投资 巨大,能否盈利取决于运营效率和平台能力;另一方面,相比于建设,中后期的运营则更为复杂,要面对更为现实的技术和应用落地问题。这也是为什么青云科技致力于通过AI智算平台打造智算中心运营新模式,成为算力中心运营者的关键工具,助力算力中心建立从建设到运营闭环的原因。
随着人工智能与数字 经济 的发展,对智算中心的需求只会持续提升。青云科技作为建设者与运营者,更要做好专业资源整合,构建良好生态,提高智算中心的使用效率和管理效率。