通用算力夺魁,北京超级云计算中心的算力突破和云端“基”遇
疫情之下,一场声势浩大的产业数字化、智能化转型大潮,在疫情催化下,喷薄而来。而在整个社会的数字化转型之下,计算力成为重要的支撑,计算力就是生产力成为共识。
超级计算需要超级算力,超算是各国竞相角逐的 科技 制高点,也是国家综合科技实力的体现。在全球前500的超算当中,中国厂商已经占据了数量上的绝对优势。而除了全球超算TOP500之外,中国超算自己的榜单也正在焕发越来越重要的影响力。11月15日,第二届中国超级算力大会召开,会上公布了中国高性能计算机性能排行榜 TOP100 ,北京超级云计算中心荣登榜单第3位。
中国超算多元化,百花齐放VS算力之争
超算是国之重器。随着新基建的推动和新冠疫情的洗礼,政企上云的意愿和行动越来越快速,也越来越坚定,这对高性能计算的交付与应用也是一个极大的促进,企业对强大算力的需求也在持续升温。各类超算中心也在尝试和探索多元化运营模式,致力于提供全谱系服务。
从超算细分市场来看,超算可以分为尖端超算、通用超算和行业超算三类。
尖端超算作为“塔尖上的明珠”,是万核以上的应用,追求极大规模,极致性能,面向攻坚型科研,国家级客户、各行各业顶级研究机构,对超算硬件系统要求极高。尖端超算领域:我国重点研发的E级超算,是每秒可进行百亿亿次浮点运算的超级计算机,被全世界公认为“超级计算机界的下一顶皇冠”。目前,我国已有三家单位发布了E级超算的原型机。
通用超算是万核以下的应用,绝大多数是千核以下的应用,针对不同类型应用,需要提供优质服务,以及更高性价比的资源,还需要满足海量无自建超算用户的日常计算需求。
正如,在发布的2020中国高性能计算机性能排行榜 TOP100中 ,北京超级云计算中心,Linpack测试性能达3.743PFlops,峰值性能达7.035PFlops,采用AMD最新的第二代霄龙处理器“罗马”,荣登中国高性能计算机性能TOP100排行榜第3位。同时北京超级云计算中心通用算力总核心已达10PFlops,与传统企业用超算相比,性能要高数千倍,也基本相当于2011年夺得TOP500全球冠军的日本超级计算机“京”的计算能力。在给尖端超算提供(国家超算中心)重要的支撑之外,北京超级云计算中心致力于服务万核以下的用户需求的和适配行业用户的需求,提供 商业 运营的通用超算服务平台,用户数已经突破2万,并且仍在持续快速增长。
行业超算是面向行业、按照行业业务需求设计完整的云上业务流程,往往是单核到几千核应用。这类客户最关注服务,然后是性能和性价比。之前我国的行业超算主要集中在能源、电信、工业制造等领域,近年来随着国内移动 互联网 的快速发展,互联网企业成为超算的重要用户之一。在2019年6月份发布的TOP500排行榜中,中国入围的219台超算中,有172台超算是垂直行业在使用。
统计数据显示,我国传统超算市场的整体规模达280亿元,其中尖端超算目前大约占四分之一,而通用超算占四分之三。但目前来看,超算主要是尖端超级计算机及其用户,中小用户和面向行业的业务型用户的需求没有得到满足。要让超算进入“寻常百姓家”,仍需在应用模式和商业化方面不断创新,探索新路。
让超算服务化,新算力催生超算“新生代”
超算的发展迭代离不开应用的创新。以前,用户习惯自己建设大规模超算中心,不仅交付周期长、建设成本高。而云交付和云运营模式的出现,使得高性能计算可以按需使用、按使用量付费,更高效也更 经济 。
新算力,新场景,新模式,正在催生超算领域的新生代,北京超级云计算中心在助力数字经济发展发展的同时,为用户带来新体验、新价值。
首先,是超算中心云化的创新。
超级云计算服务模式的出现,满足了用户随需而用的计算需求,进一步提升了科研效率。而北京超级云计算中心正式这一模式的引领者。北京超级云计算中心聚焦通用计算市场,面向海量无超算资源的用户以及中小微超算用户,重点突出性价比与优质服务,让用户通过租赁来完成业务部署,从复杂的自建与运维中解脱出来。可以更高效、稳定地服务于各类行业用户,为超算的商业化发展探索出一条新路线。
其次,是随需动态扩容的服务模式创新。
由于通用计算用户对算力需求快速增加,计算速度要求高,动态扩容就成了一种更好的选择。
2018年,北京超级云计算中心打造出随需动态扩容的服务模式,在2年时间内通用CPU已经超过27万核,计算能力突破10PFlops,实现了中国通用计算能力TOP1的水平。通过以用户需求为导向进行动态扩容,北京超级云计算中心较好地满足了用户对更多计算资源、更快计算速度、更好用户服务体验的需求,“让计算不排队”,实现了建设方式和服务模式的一次重要创新。
最后,是超算分区,分类提供资源的创新。
面向不同类型的用户需求,北京超级云计算中心提供不同的计算资源,目前主力分区是A分区,同时还有T分区、M分区、IO分区,以及科技云9分区、12分区、15分区、17分区、19分区等。此次,登榜中国高性能计算机性能排行榜 TOP100的就是北京超级云计算中心A分区。通过分类提供资源,轻松实现随需供应、不排队、省心省时计算服务。
可以看到,正是基于中国高性能计算环境和云计算技术,北京超级云计算中心为用户构建一个集硬件资源、计算环境、平台服务、智能调度为一体的“一站式”服务创新平台,通过自身算力的突破和商业模式的创新,在赋予用户更多、更好的产品服务的同时,将算力转化为更大的科研和产业价值。
融合创新与生态共建,在应用领域不断突破
和尖端超算需求相对稳定不同,大量通用计算用户有着多样化需求,且对于计算的灵活性要求更高。如何让用户实现随需使用,想算就算,需要以用户需求为导向,不断融合创新。北京超级云计算中心正通过模式创新和商业化发展,为各行各业提供诸多优质服务,帮扶企业与科研机构发力业务拓展,让应用更加便捷、高效。
比如,金风科技在全球风电市场遥遥领先,从事风资源研究已有20年历史,2016年成立风能研究院,在资源使用方面,北京超级云计算中心提供了行业化的专属资源支持方案,提供了提供独占、包核时等多种使用方式,满足不同业务部门的需求。同时配置的资源类型丰富,资源数量充足,特别在使用高峰,有效的支持资源的弹性扩展。在使用A分区资源计算过程中,系统未出现问题。计算需求以WRF和CFD为主的两个研究方向,经在A分区测试和日常生产使用,总体计算性能和速度,有明显提升。
再如,中科院物理所展开凝聚态物理研究,课题组长期致力于张量重正化群方法的发展和应用,而张量重正化群方法不仅需要多核心的并行,也需要大的内存。团队负责人向涛院士表示,北京超级云计算中心A分区的单节点256G内存和64核心正好满足了需求,使得团队得以开展对Kagome自旋液体问题进行大规模的张量重正化群计算,从而解决了Kagome反铁磁体是无能隙量子自旋液体这一长期争论的难题。同时A分区资源计算速度快,效率高,超算机器稳定,节点多,不用排队,使用十分高效便捷。
超算产业的不断发展壮大,需要产、学、研、用各方加强交流,需要算力和应用均衡发展。应用算法优化和平台优化深度融合,会产生无限的创新。在数字经济、“新基建”的引领和推动下,超算的重要性得到进一步彰显,随着我国对基础科研重视程度的逐步提升,高校、科研院所等传统客户对超算需求还有很大的提升空间。北京超级云计算中心面临新基建的重大机遇,算力突破、服务升级、模式创新,无疑将为中国超算注入新动能。