满足高性能计算需求,提供多样化使用模式 青云QingCloud EHPC为云上创新加速
在未来的五年内,数字 经济 的发展将步入快车道。云计算作为数字经济的重要载体之一,也将迎来发展的黄金时代。
据中国信通院测算,2020年,我国数字经济规模达到39.2万亿元,占GDP比重为38.6%,同比增长9.6%。大量设备入网上云,海量数据毫秒级传输,更多行业和企业获得数字升级的机遇……
高性能计算助力高质量发展
随着数字经济规模逐步扩大,以及大量设备入网上云,数据量呈现几何倍数式增长,对算力的要求也越来越高。传统的小型机、单一计算单元已经不能满足当下对算力的要求。因此,整合多个处理器或在某集群中整合多个计算机共同处理计算任务,已经成为实现高算力的必经之路。基于此,高性能计算的概念应运而生。
高性能计算是实现数字经济高质量发展的重要手段之一。在青云QingCloud( 股票代码:688316) 云平台&服务部高级总监陈海泉看来,现阶段高性能计算应用领域很广阔,但最核心的用途是用来模拟世界万物,“宏观上,可以用卫星图像、遥感数据、气象数据利用高性能计算来模拟地球、海洋和气侯;微观上,能模拟分子原子来了解生命的原理,使药物的研发更快速、更精确。”陈海泉指出。
陈海泉表示,随着高性能计算的发展,在更多的应用场景得以应用。大数据、人工智能与超算的融合就是其中之一。陈海泉将大数据和人工智能与超算的融合趋势总结为三个表现方面:
首先,高性能计算与尖端科研密不可分,不断提高的计算精度与更大规模的数据量的计算是推动 科技 进步的动力;
其次,大数据的发展驱动存储、算力的融合,“一方面,数据量不断提升,另一方面,数据类型也越来越多样化。这些数据都需要利用大数据进行处理和分析。这一改变正在驱使数据中心和算力中心互相融合,并且数据量越大,对应的算力也需要更强。”陈海泉强调。
再次,随着人工智能的发展,机器学习、深度学习对算力的需求也越来越大,为了达到足够的算力,就需要更多的GPU节点。
陈海泉表示,随着大数据、人工智能与超算融合的场景越来越多,对超算提出了一定的挑战,在他看来,现阶段,大数据的应用主要面临两大挑战。第一,存储容量较原来大很多;第二,不同类型的业务,对存储的要求也不尽相同,“客户既希望可以拥有无限的存储容量,又希望能实现高性能计算,同时对成本有一定要求。这就需要超算中心针对不同业务提供合适的存储类型。”陈海泉指出。
高性能计算的普及与推广已是必然的趋势,在这点上青云科技看得很“透”也很“远”,提早的产品及业务布局,也让企业在实现高质量发展的时候拥有充足的动能。
云3.0时代已来
谈及“计算”就不能不说说云计算。上云作为绝大多数企业数字化转型过程中的第一步,也是重要的一步。发展至今,企业对于“云”的态度已经从“要不要上”转变为“如何上”,而云的形态及业务模式也从以资源为中心,传统应用云迁移时代,到以服务为中心,业务应用依托PaaS云化的云2.0时代,再到现今的中心-区域-边缘,全域分布的云原生时代。不同的时代,企业在数字化转型过程中对云的需求也不尽相同。
伴随着大数据、人工智能、5G等数字技术的发展,企业数据量越来越大,且在数字经济发展的当下,企业对于数字资产的重视程度也愈发提升,分布式、云原生时代已到来。
IDC圈记者注意到,近日,针对超算、政企用户,基于青云公有云IaaS平台、PaaS平台推出了QingCloud EHPC产品,主要为用户提供公有云服务,同时还可为部分用户提供专属云和混合云等多种形态丰富的业务服务。对此,青云QingCloud EHPC 产品经理苗慧表示,青云为满足客户对高性能计算的需求,提供丰富多样的使用模式,适配多种应用场景,“通过统一管理的平台,使青云工程师、研究人员可以突破本地的HPC基础设施限制,在云上快速展开创新、研发。”苗慧强调。
据悉,青云QingCloud EHPC产品可提供云上超算SaaS化服务,通过青云弹性公网IP、宽带,进行快速的数据上传、下载与本地数据同步。
据悉,青云EHPC服务架构主要由三层组成,分别是资源层、管理层,以及用户端。
资源层主要包含青云的计算、存储和网络资源,以及相应的后台调度器、调度管理平台以及可视化服务平台。
管理层主要提供SaaS化的服务,从开始作业到作业运行结束,系统将自动进行折扣信息计算、计量计费和作业监控服务,能够保证用户进来之后,对团队项目、团队项目权限等相应的管理。
用户端是用户控制台,用户可以进行创建集群、管理集群、弹性伸缩、作业提交、作业编排、作业性能分析。“通过用户控制台,用户可以很方便地操作作业。”苗慧表示。
同时,在 互联网 “唯快不破”的时代,云原生的应用越来越多,越来越多的企业希望通过云原生的形式部署、运行业务,这对以Slurm 调度器为主的超算中心来说是一个很大的挑战。“QingCloud EHPC可以全面地支持各种新的业务场景,满足客户不同数据量、不同数据类型的业务需求。”陈海泉强调。
安全至关重要
对于所有数据中心而言,安全始终都是备受瞩目的一点,这点对于超算中心来说也不例外。如何保障安全是超算中心运营过程中一个亟待解决的痛点。
现阶段,传统超算中心用户在使用时,需要经历“提交申请—人工审批—安装VPN客户端—登录”的流程,过程复杂,且超算中心登录节点往往是多用户共享一个节点。由于超算为了保证自身安全,不向客户提供root权限,用户安装软件还需出差至超算中心,在现场指导运维人员安装,过程很麻烦;另一方面,Linux隔一段时间就会暴露出一些系统漏洞,如果被用户利用得到root权限,则能窃取平台上其他用户的数据,无法保障数据安全。
陈海泉表示,QingCloud EHPC平台可有效解决上述超算中心运营痛点,“以云计算技术实现安全需求。”[王1] 陈海泉指出,具体在安全层面有三个改进:
第一,计算、网络跟存储的租户隔离。因为云计算的虚拟化技术,青云天然就把计算、网络、存储对于每个租户在物理上及逻辑上做了很强的隔离。
第二,青云管理节点跟计算节点分离。租户可以使用完全独享的登录节点,不必像以前那样跟别人共享。
第三,除了传统的VPN接入,青云还能提供零信任客户端,让用户登录到超算中心的时候更便捷和安全。
据悉,青云在保证超算中心安全的同时,还提供两种不同类型的超算集群:
传统共享型超算集群。虽然计算集群是共享的,但用户登录的节点为每个用户独享,可根据用户需求自行安装软件、执行操作,与其他用户并不关联。
独享型EHPC集群。据陈海泉介绍,独享型EHPC集群可为用户提供一个root账号,客户不仅可以自由地安装需要的系统软件,还可以切换超算平台的各种软件。除此以外,该EHPC集群还可根据客户的不同业务场景需求自由搭配计算、存储和网络类型,而且客户可同时拥有自己独享的节点,做到“无需排队,一键直达”,这点在互联网业务“唯快不破”的当下,难能可贵。
展望未来,陈海泉表示,青云希望跟超算中心合作共建算力共享的算力网络,青云的EHPC平台不仅能帮助超算中心私有化部署超算云平台,还能连接全网算力提供外部资源,支撑突发业务,避免排队。当超算中心自己的资源空置时,也可对外出售算力增加运营收入。