E级超算“抢位战”打响,中国胜算几何?
10年前,我国首台千万亿次超级计算机“ 天河一号 ”一期系统研制成功,自此成为继美国之后第二个能够研制千万亿次超级计算机的国家,并于次年摘取世界运算速度最快的 超算 桂冠。
10年后,中国超算研发向着新一代百亿亿次超算(E级)挺进,接连有3台原型机诞生,有望作为国家重大基础设施支撑科技创新飞跃。
而挑战也扑面而来。就在不久前, 中科曙光 、 天津海光 、成都海光集成电路、成都海光微电子技术和无锡江南计算技术研究所5家机构,被美国商务部列入所谓“实体清单”。中科曙光与江南计算技术研究所正是其中的两家 E级超算 原型机的研制方。
一场E级超算“抢位战”已经打响。
超算竞争白热化
“这5家机构被美国列入所谓‘实体清单’既在意料之中,又在意料之外。”一位行业资深人士透露,意料之中在于中国超级计算机研制近年来加速发展,国际上中美竞争的格局已经形成,这似乎并不是有的国家希望看到的。有些意外的是,列入“实体清单”这一招来得这么快,而且还是同一批被列入,可见美方绝非一时之念。
据记者检索,中科曙光为中科院下属、注册在天津的高新技术企业,主要从事高性能计算机、服务器、存储产品开发及软件、云计算、大数据服务业务。天津海光成立于2014年,中科曙光是其最大股东。成都海光集成电路、成都海光微电子技术则为天津海光控股子公司。海光系列公司覆盖了芯片设计、制造和销售一整套环节。
其实在被列入“实体清单”之前,隐忧已开始显现。
今年6月初,美国AMD公司CEO苏姿丰就对外证实,AMD将不再向合资公司授权其新的x86相关产品,直接受影响的就是之前获得授权的天津海光等公司——2016年,AMD与天津海光签订技术许可协议,授权其x86和SoCIP用于芯片开发。
在中科曙光系公司及江南计算技术研究所上榜美国“实体清单”背后,是超级计算机领域竞争的日趋白热化。6月17日至20日在德国举行的国际超算大会上,公布的最新超算TOP500排行榜上,来自中国的“神威·太湖之光”和“天河二号”分列第三、第四位。排在榜首和第二位的,是美国的Summit(顶点)和Sierra(山脊)。
在这份榜单中,中国入围的超算数量为219台,美国的数量是116台;性能上,美国超算整体运算能力达到38.5%,中国紧随其后达到29.9%。从前四的排名亦可见,如今的全球超算已经呈现出中美竞争的局面。
创新是突破的金钥匙
针对中国超算所用零部件的“禁售令”,并非首次。
早在2015年,美国商务部在其发布的一份通知中表示,使用了两款英特尔微处理器芯片的中国“天河二号”系统和此前的“天河一号”系统被揣测用于军事目的。国家超算长沙中心、广州中心、天津中心和国防科技大学4家机构因之被列入美国芯片限售对象。
这给当时“天河二号”升级带来一定影响,但由于国产自主零部件及时跟进,并未造成太大冲击。相反,“天河二号”经过多次升级,历久弥新,至今仍保持了在国际上的顶尖性能。
当时,“天河一号”“天河二号”上已有部分我国自主研制的飞腾CPU小规模试用。据天津飞腾信息技术有限公司经理窦强介绍,目前飞腾最高性能的自主处理器为FT-2000+。基于飞腾产品的整机系统已经在政府办公设备、 企业服务 器、电信交换机、云计算平台等多个领域推广应用。“我们将全力把核心关键技术越做越强,努力支撑国家信息安全。”窦强说。
发展到“神威·太湖之光”时,其已安装40960个中国自主研发的“申威26010”众核处理器,进一步实现了自主可控。运行中,自主系统软件、自主算法编辑不仅实现了30年来我国在“戈登贝尔”奖零的突破,而且连续有项目入围该奖项,逐步构建起相对完善的应用生态。
在自主创新的支撑下,我国超算在应用中展现出了不俗实力。
在超算天津中心“天河一号”机房里,本刊记者看到,140个黑色机柜分多列排开,指示灯有规律地闪烁。中心应用研发部部长孟祥飞说,“天河一号”每天并发在线计算任务数超过1400项,做到了真正的“中看又中用”。
“天河一号”服务领域广泛。在高端装备领域,支撑海洋装备、无人机等进行数值模拟;在生物医药领域,支撑艾滋病、胰岛素等自主知识产权新药的研发并获得重大突破;在新材料研发领域,支持200多个从事纳米、储能、超导等新材料的科研团队开展计算模拟研究。“目前已累计支持国家科技重大专项、国家重点研发计划等重大项目超过1600项,取得国家级、省部级奖励成果等2000余项。”孟祥飞表示,依托“天河一号”构建了油气勘探、工业设计与仿真等十余个专业化平台,为近200家规模以上企业提供高质量创新服务,带来相关经济效益近百亿元。
“超算事业发展不能依赖别人,只有加快自主创新,才能走得更长远、更稳健。”国家超算天津中心主任刘光明说。
E级超算烽烟再起
近年来,新一代百亿亿次超算也就是E级超算,成为各国在超算领域追逐的新目标。
美国能源部已委托英特尔和克雷公司,共同建造美国首台E级超算,交付时间在2021年左右;欧盟和日本发展E级超算的完成时间均设定在2020年前后。
“它将是现有超算性能上的一次巨大飞跃。”孟祥飞说,E级超算有望在气候科学、可再生能源、基因组学、天体物理学以及 人工智能 等领域“大显身手”,协助解决目前无法解决的难题,被公认为“超算界的下一顶皇冠”。
我国在E级超算领域也有布局。2018年7月,自主研发的“天河三号”E级原型机在天津中心完成研制部署,并通过验收,预计2021年左右完成研制。届时运算能力将比“天河一号”提高200倍以上,实现跨越式提升。
在该项目实施中,我科研团队自主设计了三款芯片:“迈创”众核处理器(Matrix-2000+)、高速互连控制器、互连接口控制器;自主设计了四类计算、存储和服务结点,十余种印制电路板,核心关键技术上实现整体自主可控。
原型机系统研制成功后,天津中心随即启动了大规模的计算应用测试,用数据说话。孟祥飞说,测试涉及国家12个重大创新专项领域、数十个国家重点研发计划,专挑硬骨头。在不到一个月的时间里,力学所、物理所、计算所等中科院旗下院所,以及中国空气动力研究与发展中心、北京临近空间飞行器系统工程研究所、清华大学、西安交大等30余家合作单位轮番上阵,开展了一系列大规模并行应用测试,涉及大飞机、航天器、电磁仿真、新材料新能源、生物医药等领域50余款自主研发高性能软件和大型开源软件。测试下的原型机实力不俗,仅6个机柜就达到了与“天河一号”120个机柜相当的计算能力。
石油勘探是超算应用的主要领域之一,超算称得上“找油”利器。在原型机上的石油勘探地震正演模拟测试表明,其计算节点中一个核组的性能就达到“天河一号”单节点的1.24倍,而原型机每个节点由12个这样的核组组成,“找油”更快更准。
紧随其后,神威E级原型机也在国家超算济南中心完成部署。中科曙光牵头的曙光E级原型机系统也已完成。
一些国家均将首台E级超算的推出时间设定在2020年至2022年。可以说,今年正是E级超算研发的关键冲刺年。美国选择在此时将江南计算技术研究所、中科曙光等列入所谓“实体清单”,既是对我国E级超算研发主要及相关单位的全面封锁,也为我后续研发设置了不小的障碍。
从长计议谋未来
要想踏平坎坷,扫清前进中的障碍,离不开自主创新的加持。
从“银河”到“天河”,历经40年创新锤炼和几代超算人不懈努力,我国超算总体实力显著增强,但从全球范围看,尤其与美国相比仍差距明显,主要体现在两方面:
一方面,芯片的差距主要来自加工工艺、多样性设计与设计优化方面的差距,这受限于各类功能材料、高端加工装备、研发设计领域人才和经验积累;另一方面,软技术方面的差距,主要是立足于行业的各种高性能应用软件的开发以及应用人才,特别是交叉型应用人才在规模和水平上的差距。
虽然如此,随着高质量发展的全面推进,大数据运用、新一代人工智能发展,都离不开超级计算机。发力研发E级超算,正逢其时。
受访的业内人士表示,无论风云如何变幻,E级超算作为科研基础装备,研发不能停滞,反而要加快步伐,在核心的芯片、架构、操作系统等领域坚持自主创新,聚力攻关。
在国家宏观规划层面,可探索建立以能提供低、中、高性能的多层次高性能计算框架为目标,形成可有效支撑不同需求并且覆盖全国范围的高性能计算基础设施。
高性能计算尤其是E级超算的比拼,是国与国之间综合国力的直接较量,如何将有限的资金用在刀刃上,是各国面临的共性难题。国防科技大学研究员杨灿群等专家建议,可在高性能计算的尖端领域奋起努力,争取更大突破。同时在普及型高性能计算设备的研制及生产方面给予同样的关注及投入,从而为科研应用、制造业仿真等诸多领域构建核心竞争力。同时我国要加大高性能计算生态体系建设,实现芯片、软件、应用的全面发展。
孟祥飞说,应用软件犹如给超算插上一双翅膀,具备飞得更高的能力。可由科研单位与需求方一道,共同有针对性开展应用软件研发,为中国科研及 产业创新 提供强有力支撑。
本文已标注来源和出处,版权归原作者所有,如有侵权,请联系我们。