MIC2020 | 国家超级计算广州中心主任卢宇彤:超算与人工智能融合创新发展
2020第二届梅州 互联网 大会(简称“MIC2020”)于2020年11月15-16日在广东省梅州兴宁会展中心举办。MIC2020由广东省互联网信息办公室、广东省工业和信息化厅、广东省通信管理局指导,梅州市人民政府主办,中共兴宁市委、兴宁市人民政府、梅州市工业和信息化局承办,广东省互联网协会、兴宁市互联网协会协办,本届大会以“创新引领 · 慧聚苏区”为主题,大会内容全面升级,进一步加速梅州的互联网产业升级,聚集更多互联网产业专家学者、行业大咖展开思维碰撞,为梅州的新基建建言献策,为梅州的数字 经济 高速发展群策群力,共商共赢!
本次大会邀请到中山大学数据科学与计算机学院教授、博导、天河二号副总设计师、国家超级计算广州中心主任卢宇彤女士带来主题为“超算与人工智能融合创新发展”精彩分享,以下为演讲实录:
实录正文
尊敬的黄局长、各位来宾大家好!很高兴今天来到梅州的互联网大会,跟大家探讨超算赋能融合创新。今天是一个好日子,今天上午国家超算广州中心心梅州分中心正式挂牌,我们希望超算更好帮助梅州各个产业转型升级,能够更好地融入到数字经济的发展大趋势里面。
我今天分享的是超算赋能融合创新,其实大家一直都听过,超级计算机,到底什么是超算?我们讲超级计算机对科学发现、技术创新和产业革命都具有非常重要的作用,高性能计算也是继理论和实践之后科学研究的第三大手段,近年来,大数据处理正在成为科学研究的第四范式,超级计算比照笔记本、小规模的集群算,它到底有什么样的特点?超算帮助人们解决一系列最重要的挑战性问题,到底什么是挑战性的问题?在超算的领域里面,我们一直讲哪些问题是最具挑战性的问题?比如说在时空的范围里面,空间的尺度非常大像宇宙、黑洞,人的观测都是很难企及的,小到像分子、蛋白质,像这种微观世界的研究,还有像识辨非常快的或者识辨非常慢的,还有一些很危险的核爆燃烧之后的场景模拟,还有很昂贵的风洞试验,一次可能是500万的花费,比如说 汽车 的碰撞试验,一次也是80-100万的开销。
超级计算机可以帮助人们解决一些人类的智力、体力和实验难以企及的问题,过去40年超级计算帮助人们在科学研究方面不断向微观深入,向宏观拓展,向极端条件发展,一方面促进人类更好地了解自然的奥妙,另一方面也在帮助人们不断创造美好的生活。
超算有一个非常明显的特点,就是时代性,某一时代有某一时代的超级计算机,它是那个时代性能最高的系统,比如说我们40年以前的超算,可能性能还不如现在的 手机 ,20年以前的超算的系统可能是现在笔记本电脑,它的时代特性是非常鲜明的,它也是服务于国家的战略目标,它的战略性、前沿性属于战略前沿性的高技术,一直以来是国家创新体系的重要组成部分,而且它产生的原始创新和高端技术能够快速辐射到下游产业。
超算的处理器CPU互联网络存储器、软件这些技术被超算使用以后,可以快速辐射到信息领域各个产业,整体提升IT产业的水平。在这个方面,世界上各个大国像美国、欧洲、日本都是非常重视超算的研发,我给到的这些图片是过去45年间世界上最快的超级计算机,在我们这个领域大家也有争论,到底谁才是第一台超级计算机,我们有一个共识是1976年世界第一最快的系统,比现在的手机性能还要慢,它的占地有4个会议室这么大,当时是人类在信息技术里面的一个里程碑。
在这张图上大家可以看到,信息很多,这里面的机器大部分是美国的系统,美国在过去几十年里面对超算有非常大的投入,而且是持续投入,奥巴马政府上台以后有一个NSCI计划,包括川普对高 科技 不是很感兴趣,砍掉了很多经费,唯独加大了对超算的投入,我的美国同行拿到有史以来最高的超算经费,可以看出,超算是各个国家战略争夺的一个非常重要的领域。而且超算的能力从某种意义上可以代表一个国家或者地区科技实力、经济实力、综合实力的体现。
超算的技术发展是非常快的,这是1976年的机器,这个机器已经是接近下一代一级系统,它的峰值是500P。我们中国的超算系统天河二号是6次蝉联世界超算500强排行榜的冠军,当时破了记录,这个记录到现在也没有被打破,应该说天河二号改写了世界超算的格局,是继美、日之后第三个实现了超算系统世界第一,使中国称为第三个拥有世界第一超算系统的国家,这是跨时代里程碑的系统。
这个系统现在坐落在广东省广州市中山大学里面,大家可以看出,超级计算机本身的发展,1976年第一台超算出现的时候还没有互联网,它实际上是随着技术的进步在不断进步,我们的超级计算为了解决人类智力和体力包括实验无法企及的挑战性问题,它的核心是做模拟的,是做数字模拟的,随着技术的发展,数据的产生和积累,大数据处理从海量的数据里面挖掘出背后的知识,知识里面所能够看到的我们叫洞见。发展到人工智能的应用或者技术的时候,它和超算还是有一定的区别,比如说超算也好,大数据分析也好,我的计算规模特别大,难度特别大,数据量规模特别大,人不可能做得很好,我要借助机器,但是对于人工智能来讲,比如说我驾驶汽车也好,人脸识别也好,人做得好好的,现在要教机器做这些事情,替代人去做一些决定。
在这个过程里面,它对整个系统的结构和软件的配置不一样,人工智能是机器替代人做重复的劳动,或者使这些操作更不容易出错,或者更快速,或者准确度更高,在这个过程里面,我们看人工智能过去60年的发展史,背后是有计算能力的推动,早在2010年以前,人工智能的发展或者实用性比较差,随着超级计算能力提升25亿倍,它对人工智能的发展产生了非常大的促进作用。我们讲超算、大数据、人工智能融合,不管从系统的结构、技术上来讲,还是从应用的需求上来讲,都是一个大的趋势。
右边的图片是传统认为人工智能的应用领域,但是左边的图片是美国ECP下一代一级系统要支持的应用,这些都是科学应用,超算和人工智能的融合有两个方向,一方面支持传统的人工智能应用不断扩大规模,提升准确度,另一方面人工智能的技术帮助传统科学发现能够提升准确度,提升精度,用数字模拟和人工智能相结合的方法帮助人们更好解决科学问题。在这两个需求的共同推进下,超算又迎来发展新的机遇。
我们国家超算广州中心组机天河二号系统是国家“十二五”重点专项支持的结果,我们的系统不但在世界超算500强排行榜六连冠,我们在另外的排行榜更偏向具体应用的排行榜获得五连冠,天河二号这个系统和美国、欧洲、日本的超算中心有比较大的差异,我们的机器是世界一流的,我们的目标是做世界一流的超算应用,在这个过程里面,我们结合广东省、广州市和国家的实际,我们超算支持传统大科学、大工程的应用,我们也通过一些平台的搭建支持区域的产业转型升级。
这是我们现在支持的应用,大家可以看到,已经不局限于传统的应用,我们支持高性能计算、云计算、大数据处理和人工智能,这两个饼图可以看到,我们的应用领域非常广,包括新能源、工业制造、大气海洋、天文、地球、物理,这些都是传统的超算应用的领域,但是像生物医药健康、智慧城市、人工智能,现在在我们的超算占比都是在不断提升,尤其是近3年提升非常快。最右边的是用户的分类,主要是高校、科研机构、企业、公共服务部门比较大的占比,特别是近年来企业的用户占比和资源利用率提升得很好。超算软件使用的门槛相对比较高,我们中心主要面向领域的应用平台,因为超算的应用领域实在太多了,我们如果把软件不做区分的话,用户用传统的高性能计算的软件界面对很多行业用户来讲,其实是比较困难的,我们搭建了面向不同领域的超算应用平台,能够很方便支持像一些领域的科学家,像一些企业的用户能够方便高效使用超算。
我们通过科学运维管理,打造了行业标杆级的应用服务体系,我们现在用户账号超过4000家,服务的用户超过30万,我们超算中心的应用既有研究型的,也有业务型的,现在国家超算中心里面支持业务级应用难度比较大,我们在超算中心里面支持各种层次的应用,我们的系统资源平均利用率超过75%,最高超过90%,每天有超过4万个作业在中心运行。我们的超算中心经过这几年的发展,已经实现良性运转,我们每年应用服务的收益已经过亿,过去4年已经过亿了,实际上我们国家为止唯一一个没有政府补贴的超算中心,应该说我们通过自己的努力,应用和研发并举,走出了一条自主创新具有中国特色的超算中心的发展之路。大家熟知的六连冠是根据机器性能来排名的,这是最具应用影响力的排行榜,我们排名第五,前四个都是美国的国家实验室,应该说这几年广州中心的应用取得非常大的成效。还有一方面,在广东省湾区包括中国随着经济的发展,科技的发展,超算应用的需求非常旺盛。
超算中心主要面向前沿基础科学的研究,我们在大气、海洋、能源、材料、电子信息等方面做了很多超算应用的支持。我们还面向国家重大战略工程,支持了航空航天、高铁、水利工程、核电等等的应用。第三个方面是面向区域的地方经济社会的发展,助力智慧城市的建设,支撑大数据产业、支撑人工智能的产业发展,支持数字经济的发展。
我们超算中心大家一直也问,广州超算怎么做到支持大科学、大工程、新产业?这三个要在一个平台上支持,所以这个关键技术是面向领域的应用平台,突破超算应用平台技术,搭建复杂的超算系统和多目标、多类型应用之间的桥梁,我们有一个整体的超算融合应用支撑平台,这个平台是我们超算中心自主研发的大数据、人工智能融合应该的环境,我们把所有的面向不同领域的应用平台集成到这个平台上,覆盖的领域包括大气海洋环境、新材料与新能源、生物医药健康、大数据处理、人工智能和智慧城市的应用。
这个平台软件的建设,我们已经投入使用,边使用边完善的过程,我们的用户尤其是行业用户还有领域科学家也给了我们很多反馈,让我们不断优化应用环境,这是挂在互联网通过云计算的新模式使用超算的,我们也是国家高性能应用软件中心,也是大数据创新的工程中心。
我用一点时间给大家介绍我们中心的典型应用案例,案例实在太多了,我在各个领域选1-2个案例给大家分享一下。在天河二号我们有很多自主研发的软件和模型,比如说这个新一代多尺度的海洋模型是和我们中大大气学院合作研究的,这个模型可以支持25分钟完成全球未来10天的海洋模拟,也是国际上首次耦合南北极海冰及海洋因素全面监测气候变化带来的环境影响,这个模型是自主研发的,已经在国家气象局和气候中心推广。
后面两个是业务系统,国家气候中心中短期的气候预测系统在天河二号上运行,每个月运行一次,滚动做气候预报,在天河二号上4小时可以完成未来半年的气候预测,这些预测报告都是反馈给中央做第二年或者下半年的决策,为我国防灾减灾提供一些科学依据。
后面我要着重介绍的是,广东省广州市气象预报的业务系统在我们超算中心上运行,大家在电视台或者地铁的大屏上看到的,我们在天河二号的支持上,使广州市气象局成为国内唯一一个可以实现1公里模式业务级运行的气象局,现在广州市的区域高精度的天气预报在国内走在前列。1公里的高分辨率天气预报在天河二号上每10分钟预报一次,可以准确预报到大学城明天上午10点是否下雨,雨量是什么样的,下多长时间的雨,这个需要很大的计算量和IO吞吐能力,只有天河二号可以完成。在国际上也是领先的,国际上只有英国的气象局可以做1公里的天气预报,我们这个除了做日常的预报以外,对一些极端的天气比如说准确预测“山竹”、“天鸽”登陆的路径和对天气的影响。
在天河二号上我们实现了很多世界第一,我们也实现了国际上最大规模的地震模拟应用,使用168万个处理器,这些都是做科学研究的,其实我们在城市建筑灾害模拟方面,百万数量级的建筑群精细仿真碰到灾害、地震,一个城市的建筑群到底有什么样的影响,我们10分钟之内可以做完精细的仿真。有很多应用研究成果已经应用在珠三角的城际轨道、深圳地铁、长沙地铁、广州 金融 城地下空间等大型工程项目里面都有天河二号模拟的设计结果。
我们在国家战略工程和装备制造上,我们依托天河二号搭建应用服务平台,大飞机C919全机模拟的时间在天河二号上只要6天,过去是两年,所以天河二号为大飞机的试飞和落地起到非常重要的作用。包括核电站的设计都用到天河二号,主要极大缩短设计的周期,还有高铁,高铁我们不但做外型的设计,这是兰新线,要建一个百里的挡风墙,整个设计在天河二号上完成的。像新能源、新材料、石墨烯等等,这些材料的设计最开始是尖端科学的研究,比如说这些研究团队依托天河二号发表了《自然》上高水平的文章,背后都有产业转化的可能性,也有很多在路上,现在在做新材料的研发和产业成果的转化。
我们还支持全国最大的能源企业风能企业,它构建了整个风光能一体化全生命周期的管理平台,这上面已经走出国门,我们支持3年多,它的业务规模依托天河二号可以不断扩大,现在服务全球十多个国家,有2000多个风场的项目评估在天河二号上,每年可以节约20亿的产值。在新产业的应用和传统产业的转型升级,我们和广船、广汽有非常好的合作,广船前几年整个全球船舶的市场不是非常景气,依托天河二号的模拟和欧洲的船厂竞争中屡次胜出,广汽集团和我们合作,广汽集团依托我们超算中心建立全球一张办公桌,疫情期间广汽的设计师们不能到办公室上班,但是借助互联网可以登录到超算中心,还可以照样完成设计,现在是多级的设计平台和环境,可以利用超算中心的资源,也可以利用广汽自己需要的数据和设计模型,今年完成了3款车型的设计,在传统产业的转型升级上,依托超算可以做出很好的成果。
我们也支持像微电子元器件的辅助设计,我们超算中心这纪念支持很多新兴企业,像AI赋能产业应用,像图谱科技,他们现在都是上市公司,当时与我们合作的时候,企业规模并不是特别大,但是运用超算因为它有很大的资源,只要你把模型开发好,把应用规模用上去,覆盖用户的范围非常广,像三维家的设计也是走到欧洲,因为后端的计算能力不够,你不能够支撑你的服务。
还有生物医药健康领域,这几年在大健康的概念里,应用的需求是非常旺盛的,但是要解决的问题是,生物领域的应用千差万别,我们怎么用超算,可能有些情况是自己小的集群都用不好,如何用超算?我们在超算上搭建应用服务的平台,比如说我们搭建高通量的虚拟筛选平台,这是源于科学研究的成果,我们有一套软件系统,一天能够完成4000万分子化合物筛选,当有突发的疾病、传染病出现的时候,我们如何最快速在所有的化合物里面找到能够抗病毒的化合物,当然你找到化合物到药有很长一段时间,这个技术的使用一个是支持药物研发,还有一个是老药新用,在“非典”期间这个平台也发挥了非常重要的作用。
还有人类基因组测序的平台,包括组学分析的平台,我们8小时可以完成过去8个月的工作量,我们在天河二号上也实现了全球第一个基于3代测序亚洲人基因组的分析,这是在1小时可以完成,这个成果是当时武汉未来基因和韩国的研究团队竞争的,以前他们没有用天河二号,韩国团队的研究走在他们前面,但是他们找到我们,与我们一起合作,让他们先于韩国团队得到这个研究成果发表了文章。这只是一方面,另一方面,他的分析缩短到1个小时以内,以前要两个月,一个小时的时间使未来的临床应用变为可能,所以超算既能够解决科学问题,也能解决产业转化的问题。
国家卫健委首次做三级公立医院绩效考核,我们唯一一个拿到全国2400多家三级医院的数据。去年他们委托一家技术公司帮助他们做这个事,找到我们的时候已经是七八月份了,国家规定他们去年年底要完成整个绩效评估的工作,但是到8月份用自己的系统要260天才能评估一次,所以他们找到我们以后,我们把整个系统进行重构,在我们天河二号上7天就可以做一次,所以在10月底已经完成了这个工作,在我们天河二号上面做了三次,得到卫健委非常高的评价。今年会做全国二级公立医院的绩效考核,这涉及到大数据分析处理,这是非常复杂的系统,也是实实在在为国家的卫生健康系统怎么样使医疗资源更公平?怎么样评价医疗资源?也因为这个原因,后面我会讲到疫情期间超算中心也是国家卫健委唯一指定新冠的数据存储使用分析的中心。
在人工智能和智慧城市的应用方面,我们也做了很多工作,大家知道,广州市的公共服务交易平台大宗的土地拍卖和其他拍卖在上面做,每年大概是9000亿以上的成交量,我们也支持,中山大学有10家附属医院,和超算中心都有密切合作,我举的这个例子是眼科中心,因为我们眼科中心是全国第一,也是亚洲第一的眼科中心,他们对新技术是非常敏感的,在天河二号上他们部署了人工只能眼科医生诊疗准确度超过90%,在200多家医院进行了应用。
这是我给大家分享的平战结合,面向领域的应用平台像生物医药的平台,我们平时做科学研究的工作,战时可以快速发挥作用,大年三十我们开始做抗病毒药物的筛选,我们也做了一个肺部CT辅助诊断平台,也是国家卫健委新冠肺炎患者数据收集平台,因为这个应用的范围实在非常广,所以我想怎么讲都是挂一漏万,希望在座的各位或者通过你们把有超算需求的人与我们对接,对于超级计算的未来可以看到,现在是无处不在的计算,也是无处不在的网络,而且有快速增长的数据和快速发展的智能,超算的应用是一个多样化的需求,作为超算中心,我们也是经历技术的演变,从计算模拟、数据驱动和AI赋能这三个角度进行超算、大数据和人工智能的融合,其实要实现各行各业的应用都能够高性能、高产出,能够保证系统和应用的长期稳定的运行。超算的关键技术是非常多的,所以它和信息产业IT的产业结合非常密切。
计算驱动一切,当然我们也是从应用的需求牵引,为了满足这个目标设计软硬件一体的系统,目的是高效使用,它现在是计算科学、数据科学和智能科学的融合,我们也是新型的应用不断在牵引超算的新业态,我的对外使用模式可能是一个类似于云计算的模式,但是核心是提供超算巨大的能力。计算是创造力,是科技创新的需求,计算是生产力,是战略性新兴产业的需求,它也是一个区域竞争力的表现,它是高水平人才汇聚的需求,计算也是影响力,湾区区域引领作用的需求,我们讲的主题是,超算的集群是赋能各行各业的产业集群。
因为梅州分中心也落地了,希望能够对接梅州更多的产业需求,为加快数字产业化,推动数字经济和实体经济的深度融合做出自己的贡献,谢谢大家。