洞见存储新变化,2023年十大创新关键词
近日,浪潮存储发布2023年十大数字化创新趋势。当今世界不断变化,数字 经济 正在加速演进,算力成为驱动社会经济发展的生产力,数据成为核心生产要素。数据管理和存储作为数据的核心载体,需要跟上时代的步伐,不断迭代创新,才能充分释放数据要素价值。
那么2023年数据管理和存储领域,有哪些新趋势呢?经分析,我们从产品技术、算法、场景三个维度出发,筛选出十个年度关键词:全闪存储、分布式存储、SSD、计算型存储、分布式数据库、智能运维、东数西算、数字孪生、AIGC以及元宇宙。
图/浪潮存储
一、新产品
在产品层面,随着闪存技术逐步成熟、丰富,集中式存储正加速向全闪形态演进;分布式存储在全闪和混闪两种形态并存的同时,分布式架构呈现出多元融合的趋势。此外,计算型存储作为一种能够支撑部分数据处理任务的新形态存储产品,才刚刚起步,预计会在未来5~10年走向成熟。
1. 全闪存储
近年来,随着固态硬盘(SSD)的应用越来越广泛,集中式存储的架构渐渐往全闪存储架构的方向演进,据IDC统计,全闪存储阵列(AFA)在以集中式存储为主的传统企业级存储市场(TESS)的份额占比上升至39%。越来越多的本地供应商开始专注于高端全闪产品,端到端NVMe AFA产品不断涌现以服务于需要高性能的业务场景。数据显示,全闪存储2022年市场增速约为21%,同期中国存储市场增速为7%。全闪存储成为企业关键业务的新选择,凭借高IOPS、低时延、高可靠、高安全等优势批量进驻 金融 、证券等关键行业。
2. 分布式存储
分布式存储作为近几年不断被熟知的存储产品形态,不断被市场认可,凭借性能、系统可靠性、扩展性等方面的优势,在 互联网 、人工智能、大数据、云计算等新兴场景中被广泛使用。据IDC统计,2022年分布式存储份额为23%,预计到2026年市场份额将达到28%,成为中国存储市场的重要组成部分。
分布式存储因其支持块、文件、HDFS、对象多种协议的特性,被广泛应用于内容资源池、备份归档、视频存储、云平台存储等多个场景,具有较好的场景适应性。目前Dell EMC、浪潮信息等厂商成为分布式存储领域的主流厂商。
3. SSD闪存盘
在存储产业闪存化趋势带动下,由于NAND闪存介质具有高性能、低延时的特性且Flash颗粒单位成本不断降低,SSD市场迎来高速发展。据IDC预测,SSD有望突破成本瓶颈,凭借访问速度和存储密度优势,代替机械硬盘成为市场主流存储介质,预计到2025年全球的SSD市场规模将由2020年的300亿美元增长到约为500亿美元。其中企业级SSD的技术开发壁垒相比较高,代表厂商有浪潮信息、Samsung等 。
4. 计算型存储
2023年,计算型存储(Computational storage)成为新的存储产品形态,将带来IT架构的变革。计算型存储能够将部分数据处理的任务交给存储层,而不用把数据挪到主机里用CPU来处理,这样可以节约数据迁移时间、带来更低的业务时延。
随着AI 在各领域的应用逐渐广泛,深度学习需要系统高效处理海量的非结构化数据。而传统冯·诺依曼体系下运行的计算机通常包括存储和计算两部分,数据需要在处理器与存储器之间进行频繁迁移。如果数据的传输速度跟不上CPU的性能,就会导致计算能力受到限制,出现“内存墙”、“功耗墙”。计算型存储,能够在实现数据存储的同时直接进行计算,能够消除数据迁移带来的时间成本和能耗。在大规模并行计算场景中,例如 VR / AR、无人驾驶、车联网等场景,计算型存储具备高带宽、低时延、低功耗的显著优势。
目前,计算型存储已经在产业细分领域掀起了 创业 浪潮,受到 投资 界和产业界的高度关注。计算型存储在技术上向着高精度、高算力和高能效的方向发展,基于非易失性、新型存储元件的计算型存储依赖于工艺、良率的提升,走向成熟预计需要5-10 年。
二、新算法
算法层面,运维管理平台、数据库作为数据基础设施的关键组成部分,正在加速创新。
1. 智能运维(AIOps)
数据爆炸趋势下,运维管理上大量依赖人工已经不能满足应用需求,企业将更多依靠人工智能进行自动化运维,Gartner认为AIOps的广泛应用将让IT基础设施管理变得更主动、更具预测性,能够有效减少管理和停机成本。
存储的AIOps就是通过AI技术实现存储自治,即自我管理、自我修复、自我调优,提高存储系统的性能、稳定性和易用性,降低存储使用的复杂性,简化运维,使存储设备永远保持在最优运行状态,加速数据在线。
未来,随着超大规模数据中心数量的不断增长,AIOps技术将迎来快速发展。Gartner预测到2025年,30%的企业级存储将使用AIOps来进行IT硬件管理和维护,而2022年这一比例还不到3%,智能运维将成为业界的趋势。
2.分布式数据库
自上世纪70年代问世以来,关系型数据库经过了40多年的发展,目前仍旧是数据库市场的主流。在核心应用领域,尽管大数据技术的应用提升了市场对非关系型数据库的关注度,但关系型数据库在其核心应用领域的重要性并没有降低,据IDC统计,关系型数据库在中国数据库总体市场中的占比仍超过60%。
在新兴领域,随着移动互联网、大数据、人工智能、IoT、5G等新兴技术的快速发展,数据的产生速度和使用方式都发生了变化。数据呈现出海量规模和高速增长的态势,数据的部署环境也日益复杂,传统关系型数据库在应对某些极端场景时面临挑战,而分布式关系型数据库的优势得以显现。分布式关系型数据库利用分布式技术,突破了传统集中数据库的容量与性能瓶颈,简化了运维工作,并有效降低了对高性能硬件的依赖。近年来,中国分布式关系型数据库市场呈百花齐放的态势,新兴数据库厂商、云厂商、大数据厂商、数据库服务商、系统集成商等供应商都相继推出新产品。
三、新场景
伴随新应用爆发式增长,无论是国家级的东数西算,渗入各个行业的数字孪生,当红的AIGC还是“包罗万象”的元宇宙等等,都成为当前业界的热点。
1. 东数西算
中国数据中心格局,正发生改变。今年,在一批云厂商的积极布局下,一座座数据中心建成落地,坐标却绕开东南沿海和一线城市,选址在成都、张北、乌兰察布、重庆等地。这种趋势概括起来就是:中国数据中心格局,正在向西推进。
运营商成为推进东数西算落地的先行者,中国运营商已经建立起全球规模最大的网络。同时全国约50%以上的IDC(互联网数据中心)都是由运营商提供。例如,某家运营商累计投产云服务器和存储超66万台,构建起“N+31+X”资源池体系,即建设N个中心资源池,面向31个省份建设若干省级节点,在全国范围内灵活部署X个下沉式边缘云,100%覆盖“东数西算”核心枢纽,能力辐射全国。
2. 数字孪生
2003年,美国密歇根大学Michael Grieves 教授首次提出了“数字孪生”的概念。数字孪生最早应用于航空航天领域。随着新一代信息技术的成熟,数字孪生开始向智能制造、智慧城市、金融、交通、科研、医疗及农业等垂直行业拓展。
例如,在金融行业,随着数字孪生技术的不断成熟,金融机构可以利用数字孪生技术构建“数字经理”,为客户提供个性化、定制化服务,还可以将其应用于金融产品研发,在数字孪生模型中进行产品的迭代设计等。
再如,在科研领域,复杂、多尺度(multi-scale)的数字孪生应用将会出现,包括天气和气候模型、地震现象、材料特性、类脑研究等。这将推动当前的科学模拟实现百万倍加速,带来新的科学洞察与发现。科研领域对数据有很强的需求:基于对海量数据的高维建模能力,可以对特定科学问题进行预测评估,典型案例如AlphaFold2。同时,“科学原理+数据计算”新方式将科学模型的AI精准解析作为机器学习的数据来源之一,催生第五范式的产生。
又如,在交通领域,数字孪生是交通行业实现数字化、网联化和智能化发展的重要技术手段。在全天候、全要素数字孪生的基础上,自动驾驶开发和测试的安全性获得提升,时间和资金成本不断降低,推动自动驾驶加速落地。当前,自动驾驶新应用成为推动存储市场发展的重要力量:在车载存储领域,L3水平时车内数据容量将达到512GB以上,到L5时将更高。例如自动驾驶卡车的存储容量需求在1TB至2TB之间,而自动驾驶出租车领域的配置是4TB。NAND Flash将成为车载存储领域的主力存储技术,数据显示,从2020年到2026年, 汽车 存储NAND的年复合增长率高达66%。在道路方面,车路协同成为自动驾驶的重要推动力,端-边-云数据基础架构能够确保汽车行驶过程中数据处理的时效性,例如,中国首个车联网项目基于分布式存储构建了边缘云数据中心,以便实现巨量数据的实时处理。
当前,全球加速布局数字孪生应用,美国和德国分别成立了数字孪生联盟和工业数字孪生协会,中国已将建设数字孪生城市被写入“十四五”规划,成为国家发展战略。据Global Industry Analysts预测,到2026年全球数字孪生市场规模将达到287亿美元。
3. AIGC
2022年,效果惊人的Disco Diffusion、Midjourney、DALL·E2和Imagen AI,让大众切身体会到了AI在图像生成上的惊人表现。
而这只是AIGC(AI generated content,生成式AI)的一个缩影。作为一种能够从巨量数据中学习对象的特征利用现有文本、图像或音频文件创建新内容的技术,生成式AI未来将进一步发展,不断拓宽应用边界并将为数字化内容的制作方式带来变革。
随着技术进步和成本降低,生成式AI将成为一项普惠 科技 ,大大提高内容创作的丰富度、创造性和生产效率。在未来三年,生成式AI将进一步市场化,形成更多样的 商业 模式和更完善的产业生态。生成式AI模型将在交互能力、安全性和智能化方面获得显著进展,辅助人类完成各种创造性工作。预计到2030年,AIGC市场规模将超过万亿元,并且这项技术将在生命科学、医疗健康、制造、材料科学、 媒体 、娱乐、汽车、能源等行业得到广泛应用。
4. 元宇宙
近几年,元宇宙迅速全球。在国外,Facebook宣布业务布局转向元宇宙,公司改名为Meta,并打算将 VR 设备打造成人们通向元宇宙的入口;在国内,字节跳动以近百亿的价格收购了VR创业公司Pico,成为目前为止中国 VR 行业最大的一笔收购案,素有“中国V谷”之称的马栏山视频文创园结合视频产业云创建了属于自己的元宇宙。国内外各大科技巨头纷纷开启了探索元宇宙的步伐,机构也对元宇宙报以积极态度,Gartner预测,2026年25%的人每天将至少在元宇宙中工作、购物、学习、 社交 或娱乐1个小时;全球30%的企业机构将拥有元宇宙的产品和服务。
元宇宙,不光推动了VR设备的发展,还将给新一代计算、存储平台带来结构性的变化。元宇宙具备沉浸式、低延迟、随地、多元化的数据特征,将带动数据基础设施的重构,比如中国V谷马栏山为支撑包括元宇宙在内的创新应用,采用“公有云、驻地云、边缘云、私有云”混合架构,基于“数据不动、算力动”的设计理念,让算力可以随意地去计算各处的数据,提升了创作的效率。
总结:当前,中国数字经济进入深化应用、规范发展、普惠共享的新阶段,数据要素成为数字经济深化发展的核心引擎。基于安全可靠、经济高效的新型存储平台存好、管好、用好数据要素,将为数字经济发展带来强劲动力。