浪潮王恩东:数据社会化,计算+将成数据引擎再进化原动力
作者:尚吉刚
数据正在包围并改造着世界。据市场调研公司App Annie预测,2020年全球的数据保有量将达到35ZB。在数据存量越来越庞大、计算压力越来越大的今天,计算会不会成为人类迈向智慧社会的瓶颈?在2016浪潮技术与应用峰会上,浪潮集团执行总裁、中国工程院院士王恩东在发表主题演讲时明确指出:“数据资源化是数据社会化的先决条件,而计算是数据资源化的关键承载,计算+将成为数据引擎在进化原动力。”
数据大爆炸,计算力将成为数据社会化的动力源
王恩东在主题演讲时,描绘了数据资源急剧膨胀、数据社会化的行业大背景。如同智能终端迅猛地催热了移动互联网产业,海量传感器汇成了万物互联网巨大的数据洪流。据BI Intelligence在研究报告中预测,到2020年,全球将有高达340亿设备连入互联网,其中物联网设备将达到240亿台。
另据市场调研公司App Annie预测,全球智能手机和平板电脑的保有量,将在2020年达到62亿部,相比2016年26亿部的保有量,会有139%的巨大增幅。
这些新增的海量设备与以往不同,它们大多都会连入互联网,并且每天诞生更加惊人的天量数据,当乘法中每台设备产生的数据量和设备量都出现激增,那么相乘之后就有可能形成恐怖的指数级暴增。王恩东现场算了一笔数据帐,现在一一款智能终端平均带有16种传感器,每天可产生1GB的数据,如果按照全球26亿部智能终端计算,一天新增的数据量就高达2.6EB;现在中国公安机关安装的监控摄像机近300万台,数据一般都会保存30天,这就会产生3EB的庞大数据。
如果按照2020年340亿台设备连入互联网计算,届时人类社会将产生的数据量会高达35ZB(1ZB数据,需要2的30次方块ITB硬盘才能装下)。
有人把大数据视作未来最重要的生产资料,其未来战略价值甚至超过石油。但就像把过量的珍馐美味摆在一个美食家面前一样,胃部有限的消化能力,意味着有心无力。同样,过量的数据也会带来”消化不良”的问题,目前世界最快的神威·太湖之光其峰值算力为125PFlops,距离E级计算实现还需有近百倍提升,所以当面对ZB级数据时,计算能力的提升就变得迫在眉睫。
在王恩东看来,在这个过程当中,在前端通过智能设备进行数据采集,数据在经过预处理后形成有价值的信息,通过网络传输到后端数据中心,进行存储、建模和统计分析形成知识,再进一步通过分类、归纳、演绎和预测等深度分析和挖掘为我们的工作和生活的决策提供服务。这里面的每一个环节,都是通过计算来完成的。因此,计算是数据社会化的关键。
计算三大形态日渐清晰,应用特性决定计算升级路径各异
兵来将挡,水来土掩。有人可能会说,既然计算如此重要,那么我们提升计算力就好了,但事实上,典型应用和典型数据的差异性,对计算的需求也是各不相同,所以计算升级的路径也各异。
王恩东在接受专访时表示,计算从过去单一的数值计算,随着各种计算离乱的不断成熟和计算能力的持续增强,计算演化到今天,最终形成了关键业务计算、智慧计算和科学计算三中典型形态,这三种形态会在相当长的时间内共存,其应用领域和对应的数据类型也各具特征,所以计算力的提升需要从需求和应用的原点去考虑。
关键业务计算,其实大家平时在生活中也能感觉到有它带来的便利,我们在网络购物时进行的网银支付,在711买完早点之后进行的微信支付,去外地出差是用12306订高铁票,这些其实都是关键业务计算在发挥作用,这类计算要求超高稳定性和安全性,所以未来的发展重点就是加强高性能和高可靠性。
智慧计算主要应用在万物互联网领域,数以百亿计的传感器作为数据采集源头,再加上互联网的贯通,编织了一幅幅智能交通、智慧医疗、智慧城市、社交网络、人工智能的宏图。王恩东指出,以云计算、大数据和深度学习为代表的智慧计算,在未来几年所占的市场份额将快速增加,有可能会在2015年1/2左右的份额,在2020年达到2/3,甚至在2025年会达到4/5,成为未来计算最主要的组成部分。
科学计算,已经成为了人类探索未知的重要工具。过去常说天机不可泄露,但现在人类科学家利用超算来做气象预报和气象灾害已经非常成熟,但阻碍预测精度进一步提升的正是计算力的限制。就比如要实现200公里网格分辨率精度的模拟,需要千万亿次计算能力,但如果要实现25公里网格分辨率模拟,则需要10亿亿次。
如果把视野放在探索未知的宇宙上,科学计算的压力会进一步增大。目前全世界最大规模的射电望远镜阵列SKA,用于探测星系演化、引力波等,每秒钟就将产生1.5TB的数据,每天129个PB的数据,数据的极大增长需要计算能力的匹配和支撑,在某种程度上来说,人类的计算能力,就是认知世界的边界。
从上述的一些典型应用中,我们可以看出,关键业务计算,通常对应的是结构性数据,其数据增长大多数还是线性增长,而智慧计算和科学计算,则对计算能力的提升提出了指数级提升的苛刻要求。在摩尔定律宣告终结,单个计算节点性能提升幅度受限、功耗挑战不断增大的今天,计算该如何进化?浪潮给出的解决之道是计算+战略。
计算+,借融合架构实现技术和业态重构
在限制重重的条件下,如何实现计算的再进化?王恩东在接受专访时表示,要想在现有的科技和工程条件下,进一步挖掘计算潜力,融合架构是必然的技术选择,过去太过于依赖芯片带来的性能升级,现在需要从架构创新层面去重新认知。在浪潮的理解中,融合架构就是面向应用的硬件重构+软件定义。
融合架构的设计思想是通过硬件解耦实现资源的物理池化和动态重构,通过软件定义实现业务感知的按需资源组合与配置,满足计算系统的弹性伸缩和超大规模的持续扩展。融合架构不仅仅会改变数据中心的技术架构,它甚至会引发产业的融合和重构,现在其实在ICT产业的融合其实已经在发生。
在现实中,遵循硬件重构+软件定义,计算+SDN/SDS已经在部署中实现了初步的计算、存储、网络融合,用户其实不会再去区分你是服务器厂商还是网络厂商,因为他们需要的是一揽子解决方案,原有的专用设备会越来越少,而硬件在通用性得到保证之后,只需在添加定制的功能模块和软件就可以实现专用设备的大部分功能。
浪潮与思科在NFV、SDDC、IoT等领域的产品及技术已经开展了很多落地的合作,并且部署在信息基础设施、云中心、智慧城市等典型应用场合。在我看来,未来计算、存储、网络正在变得越发依存、不可分割。
据王恩东院士介绍,浪潮在践行融合架构上已经做好了充分的准备:浪潮面向关键业务计算,已经有了K1主机、AS18000存储系统和K-DB关系型数据库,而且今年还将发布新一代主机系统;在融合架构模块化服务器上,浪潮SR整机柜更迭到了4.5,从非IT模块集中化发展到硬件的IO池化、存储池化,创造了一天上线1万台服务器的新纪录;为满足深度学习应用的旺盛需求,浪潮采用协处理优化节点,可以在一个机柜中提供160个GPU或者MIC卡,比传统的方案密度提高了4倍。在加上云海OS在软件定义层面的统筹和管理,所以浪潮有信心通过融合架构让计算实现再进化。
融合架构,离不开足够强大的“朋友圈”支撑
融合,是未来计算,甚至是科技进步的一条主干道。但融合,也对原有的业态格局和利益分配造成了严重冲击。所以对于力推融合概念的浪潮而言,让自己的融合架构朋友圈变得更加强大,就变得异常重要。浪潮已经与英特尔、思科、VMware等国际巨头,在融合架构上进行了深度合作,但未来需要引入更多重磅的合作伙伴,这样才能让典型用户真正放下顾虑去拥抱融合架构。
浪潮此次提出的数据社会化,用计算来推动数据资源化,其实与之前全球大数据阿莱克斯·彭特兰是提出的社会物理学殊途同归、互为映衬。彭特兰教授的社会物理学,主要是强调在物质和能量之外,思想、信息的流动,对于人类社会产生的巨大影响力,其研究的核心工具其实就是大数据,而计算+正是将数据资源化的关键前提。
在过去,计算力是非常重要的生产力,但现在随着智慧计算、科学计算的指数级需求刺激,计算力已经成为创新力重要的物质基础,计算力正在承担着人类科技进化的主引擎角色。想象力和好奇心,让人类认知世界和宇宙的边界在不断外延,而计算力不断进化,决定着这种外延的实际边界。
End.