曙光HPC首席科学家吉青:高性能计算不只AI,曙光更注重技术创新
“今年确实明显感觉到了 人工智能 服务器需求的爆发式增长, 中科曙光 作为业界领军企业针对AI也准备了整套解决方案。”
“人工智能其实只是众多高性能计算的应用方向之一,中科院出身的曙光更在意技术上的挑战。”
中科曙光高性能计算产品事业部首席科学家、麻省理工博士后研究员吉青在接受亿欧专访时表示。
中科曙光,国内专注高性能计算机和 大数据 、 云计算 等相关业务的上市公司之一。中科曙光源自中科院计算所,90年代至今,共研发了7代高性能计算设备,其中93年研发的中国第一台高性能计算机“曙光一号”,成功迫使西方解除了对我国高性能计算机的禁运。经过几十年的发展,目前曙光的业务已经覆盖服务器、大数据、云计算、存储、安全等多个领域的产品,面向电信、医疗、气象海洋、互联网大数据等多个行业提供整体解决方案,多次进入全球高性能计算top500排名的前五名。2014年中科曙光在A股上市,2017年前三季度营收达到37.9亿元。
AI高性能计算更快还要更准
近两年AI的兴起,对高性能计算设备的需求猛增, 曙光也针对AI的需求,从产品、平台、解决方案三个层面,准备了整套解决方案。吉青告诉亿欧, 除了通过高性能计算,帮用户解决更快的问题,曙光还提供数据服务,在有据可查、有据可依的基础上,帮助用户做的更加准确,通过AI获得高效价值的提升。
产品层面,曙光成立了专门的研发团队,针对神经网络的训练和推理需求,研发高性能服务器产品,其中XMachine系列高性能计算服务器产品已经量产。 曙光还在与BAT等互联网知名公司联合研发AI计算产品 。 面向训练端的密集型计算需求,曙光提供整合GPU、MIC加速器的超高计算力的服务器产品。“ 全球每8台GPU服务器就有1台来自曙光 ”。推 理对高并发响应速度要求更高,除了传统CPU服务器,曙光今年还发布了 全球首款基于寒武纪AI专用芯片的AI推理专用服务器 , 单节点峰值计算能力超过100TFLops, 与一般处理器 效能比大概能达到30:1,高出了很多。
软件层面,针对大部分用户经验不足的现状,曙光将常用的TensorFlow、Caffee等神经网络框架、ImageNet等公开数据集都整合起来,封装成 对用户更友好的“Sothis AI“管理平台 ,方便用户便捷的进行离线训练、在线训练等相关的操作,简单易用,快速部署。“ 就像在Windows下,通过点击,选择需要的算法和数据库,再进行点击就能够进行试算 。”
云平台之上,曙光还提出 AI ABC²整体解决方案 。曙光高性能计算有很长的历史,有很多大客户,他们需要从传统的高性能计算中心,升级为大数据、云计算中心,以及人工智能中心,这样一来,对这些服务进行统一服务和统一调度形成成为新的问题。中科曙光的ABC²方案由此诞生。ABC²对下可以对所有的硬件进行管理,对上可以基于场景驱动具体行业应用。 ABC²整套 解决方案在10个方向进行了深度定制 ,在安全防护、交通管控、国土资源、智慧校园都有成熟的方案,在全国多地,甚至海外,都有落地案例。
以现有解决方案为基础, 曙光也可以作为贯穿上下游的解决方案集成商,面向最终客户提供“一站式”解决方案。 曙光团队有来自 各行各业的专业人士,从行业角度提出解决方案,并采用曙光提供高性能计算相关产品服务、合作伙伴提供 摄像头、算法、高速网络等其余产品和服务的方式, 共同为客户完成整套AI解决方案的部署。通过这种方式,曙光把整个产业的各个环节的厂商整合在一起,优势互补,各取所得,友好合作。
不同于单纯强调速度快,吉青告诉亿欧, 曙光还追求算的更准 。要算的准的话,一是需要数据足够多,足够新,足够全。例如以13亿人的数据来算,肯定比3万人要更加普适。二是算法要很先进,比如增加深度网络层数,或者进行系统性优化。
吉青告诉亿欧, 为了达到算的准,曙光在多方面做了努力。计算平台方面各家差别不大,但曙光提供了性价比更高的寒武纪芯片方案。曙光深度优化的算法集XSharp,较市场上开源的基础库性能有显著优势。例如在医疗影像识别方向,曙光的XSharp算法集的准确度是常见开源库了200倍以上。数据层面,基本所有的开源库都可以集成到曙光的SothisAI平台。
HPC不只用在AI
吉青博士在高性能计算领域有多年的经验, 对于高性能计算及其应用,有深刻的理解 。 在中国科学院化学研究所取得博士学位后,她先后在法国国家科学研究中心和美国麻省理工学院担任博士后研究员,曾任国家超级计算天津中心国际合作主管,亚洲的超算协会总监等职务。
在吉青博士看来, 高性能计算 就像一个螺丝刀 ,各种场景都可以用,实际上每个人也在用,只不过过去高性能计算大部分都是面向了政府、企事业单位和数据中心等,和普通人中间隔了一层,不被大众所感知。“实际上高性能计算和每个人都有关,比如我们每天都在用电,国家电网的调度就是高性能计算在支持,电力的调度和模拟是高性能计算的重大应用方向。”
吉青告诉亿欧,高性能计算的应用场景非常多, 包括了:计算材料、生物、精准医疗、气象(大气海洋、环流)、石油勘探、石油加工、遥感、数据仿真、风电等等。 关于高性能计算,中科曙光 也正在牵头编写一部关于高性能计算的著作,里面会有详细的介绍。
相比之下,AI只是高性能计算的一个应用方向。“ AI之所以受到关注,因为AI提供了一种可能性,以往我们都是自己要想办法,通过物理和数学等去构建一个模型,现在AI 让我们可以通过训练得到一些模型, 超越了人的认知, 但是可以准确的进行预测。”
最近AI高性能的市场增长也非常显著,不过吉青博士认为, 这是目前的短期想象,未来还不好说。 最近全球互联网公司高额投入采购HPC,体现出短期人工智能市场的剧烈增长, 短期内甚至形成了AI和传统市场倒挂的现象, AI一个应用方向市场占的比重可能就和其它应用方向之和一样,显得人工智能市场占比尤其突出。
但 AI未来能否保持对高性能计算的需求? 吉青表示: “ 保持谨慎的乐观” 。 “ 新兴名词在IT发展过程中并不鲜见,比如大数据、云计算,火个两年就过去了。以当前来看,AI比之前的更接地气,在安防等领域确实有实际的落地, 也 可能AI应用未来真的会很广 泛 。但也 可能只是因为刚刚发展, 现在还是基建阶段,高性能计算作为基础设施率先爆发。 未来AI能否完全改变人类的生活,也未可知,就像微信刚出来,我们也不知道能像现在这样深刻影响我们的生活。”
除了AI,吉青告诉亿欧, 最近热门的智慧城市等,也是高性能计算的重要应用场景 。曙光09年就注册了城市云商标,已经在全国落地了40多个城市云,落地之后在各地方发现了跟多新的有当地特色的需求, 比如内蒙、河北可能很关心环保,上海更关心金融, 无锡云中心,则是跟当地各种教育机构在合作。
此外联合办公、央视全球媒体直播平台、城市交通规划优化、物流异地统一调度等,也都是高性能计算和城市云结合的具体应用方向。“ 通过这样落地的城市云,使得高性能计算能够和各地、各行业的应用进行深度融合。这是一个非常好的趋势。”
物联网目前发展也很快。吉青博士认为, 物联网通过边缘计算,一定程度上缓解大型计算中心的压力,但 未来 基于物联网的各种应用,都还是离不开高性能计算的支持 。 面向未来应用非常广泛的物联网, 目前高性能计算整体还是不够的,还有很多发展空间。
曙光更注重技术创新
“每家公司都有自己的特点,曙光从中科院计算所出来,对研发有骨子里面的激情。”吉青告诉亿欧。“就比如跟老板说,这个项目能赚多少钱,他会说good, 如果说这项目是全球顶尖的最先进技术,他眼睛会发亮!
“ 对于 新兴的技术前沿,曙光的投入、关注和热情会高一些,曙光也鼓励员工发paper。 对新技术的架构有想法的客户,更愿意选曙光,因为有些东西不是其它家能做的出来,或者能想到一块的。比如 最近推出的叫M Pro的产品,全球只有曙光和Facebook在做,现在一个互联网巨头也已经看上了要做 。曙光也率先推出了可以重构的云服务器,可以通过软件来定义是用作存储,还是用作服务器。”
采访的最后,作为曙光的高性能计算领域首席科学家,吉青博士也表达了对我国高性能计算产业整体发展的忧虑。“之前 很多人总是质疑中国高性能计算应用为什么做的不好,这主要是因为 高性能计算产业链很长 ,技术环节很多,既有硬件的方向,又有 应用算法、编程、编译器等 应用和技术的方向,还有具体应用的物理模型等, 中间牵涉了很多步骤,每个步骤都需要完善, 而中间这些还没有引起业界的广泛关注, 整个产业的进步还各个环节同仁共同的努力。 ”
版权声明
凡来源为亿欧网的内容,其版权均属北京亿欧网盟科技有限公司所有。文章内容系作者个人观点,不代表亿欧对观点赞同或支持。