国家超算济南中心青云科技:智算中心运营难 轻松“拿捏”!
国家超级计算济南中心(简称:济南超算),于2011年10月由国家 科技 部批准成立,落地了国内第一台采用完全自主处理器的超级计算机。
建成全球首个超算科技园的济南超算,也一直积极布局围绕超算应用生态的产业升级,重视对学术科研的平台支撑能力的同时,推动成果转化,比如,与青云科技深度合作,联合算力服务创新。
依托新模式,算力资源随手可得
在资源平台建设上,济南超算主要围绕了五个平台进行规划建设,包括高性能计算、人工智能计算、云计算,与高性能计算紧密相关的工业仿真计算,以及围绕数据构建的数据存储与灾备平台。
整体建设思路遵循多元算力融合、混合异构融合。面向通用应用场景的超级计算集群,整体算力达到 60PFlos,存储容量达到17PB,数据传输带宽达到1TB。人工智能计算集群上达到1000PFlos规模,目前超过2500个节点。云计算集群现在覆盖从IaaS、PaaS到SaaS,超过60种云服务。
依托青云AI智算平台,济南超算的“山河云”统一纳管了多种架构的服务器,形成资源的统一调度,所有产品与服务都能够在云端使用。在持续丰富超算应用与AI场景的同时,青云科技还支持了济南超算超5,000台桌面云。在边缘计算上,基于数据中心的物联网平台,济南超算与青云联合打造了边缘推理服务。
在整体网络建设资源方面,对外 互联网 出口网络带宽已超过15Gbps。其中,网络接入主要基于青云智能广域网的能力。
最终,依托AI智算平台,济南超算实现了不同类型、不同性能的IT基础资源的统一纳管,也打破了传统HPC和AI算力的应用模式,实现了精准的计量计费与用户自助服务,大幅减少管理员的运营运维压力。
推 进 算力网络建设 ,支持全场景创新
济南超算自2019年起主导了覆盖全省的算力网络建设,到2023年底已经构建起山东16地市的“山东算网”,并陆续在科研、教育、工业、民生等领域的算力应用做落地、实施和验证,同时计划到2025年,打造面向黄河流域的算力平台,构筑5ms算力圈。
济南超算的算力服务主要围绕山东省内产业和山东规划建设的“大科学工程”展开。济南超算认为如果应用可以划分成工作流的形式,都是适合使用算力网络的。青云AI智算平台不仅支撑底层多元异构的资源调度,也在数据的存储、采集与流转等方面发挥了作用。
生态环境。 2021年起开始运营的国家生态环境大数据超算云中心,为生态环境部提供各类高性能计算资源,支撑国家环境质量预测预报平台、北京冬奥会专项保障、山东省环保厅空气质量预测预报等。
工业互联网。 济南超算支持了传统超算擅长的领域——高铁气动仿真。高速列车模型需要大量计算,如果专门自建高性能计算中心投入大、周期长。基于山河云,就能直接进行数值分析、与前期实车测试对照分析、确定合理仿真模型及优化方法等。
智慧政务。 其中,山东电子政务云实现了云计算、高性能计算、人工智能计算集群之间的算力资源的弹性扩展,并且在山河云平台做了租户级的资源隔离,承载了约 30 个省直单位近 300 个政务信息系统上云,提供了超120 项云服务。
智慧医疗。 济南超算与国家健康医疗大数据北方中心、省千佛山医院等单位合作,研发在线病理云标注系统、乳腺癌免疫组化 Her2 等级判断系统、病理切片质控系统,以人工智能赋能医养健康产业发展。
对地观测。 济南超算与空天院进行深度合作,建设了济南到北京的遥感专线,专门用于汇聚遥感数据,计算集群同时支撑针对遥感数据的分析处理。[斐任1]
智慧教育。 济南超算基于青云AI智算的开放PaaS平台,打造了“水滴实验营”教学实训云平台,先后为十余家高校提供 10 万课时服务。
人工智能。 济南超算依托青云以及其他合作伙伴正在共同推进自然语言巨量模型训练的相关工作。
青云 AI 智算平台致力于打造算力中心建设运营的新模式,平台具备自主创新、功能完善、智能运维、成熟运营、开源开放、安全合规、中立可靠、灵活部署八大优势,助力济南超算实现了多元异构算力的统一管理,在算力调度、智简运维、生态建设等方面都发挥出了技术价值,济南超算建立并运营了面向全省多行业的算力服务平台,实现了 经济 价值与社会价值双收获。