业界首个《分布式融合存储研究报告》发布,打造智算时代新存储底座
2023年11月30日,中国电子技术标准化研究院、存储产业技术创新战略联盟联合华中 科技 大学、中山大学、之江实验室、浪潮信息、天翼云等20多家学研机构、企业和用户代表,共同撰写的业界首个《分布式融合存储研究报告》(以下简称:《报告》)正式发布。《报告》首次系统梳理并深入分析了分布式融合存储的概念、技术架构和应用场景,为融合存储产业发展提供参考和指引。
中国电子技术标准化研究院领导表示,“数据成为重要的生产要素,数据存储和数据管理在信息技术变革中的作用更加显著。分布式融合存储作为存储新技术,在数据存储领域将会发挥更大作用。”
中国计算机行业协会信息存储与安全专委会会长、华中科技大学教授谢长生表示,“存储作为数字技术底座之一,既得到空前发展也面临巨大挑战,分布式融合存储就是迎接这种挑战的关键技术,该报告汇聚了学术界、产业界和用户的集体智慧和经验,描述了一副全景视图。”
《分布式融合存储研究报告》
分布式融 合存储 将成为 智算 时代的数据基石
中国工程院院士、清华大学教授郑纬民指出,“数字化和智能化催生数据量爆炸式增长,分布式融合存储技术的出现,不仅可以提供数据存储的效率和安全性,还可以实现数据的动态管理和智能优化,为各种应用场景提供更加全面和可靠的数据支持。”
《报告》指出,相较于传统的分布式存储技术,分布式融合存储是在传统的分布式存储架构的基础上,实现了同一存储集群同时提供多种存储服务,并且在非结构化数据协议间实现了协议融合、数据融合互通的存储技术,其能够提供跨模式/格式数据共享互通的能力,并支持块、文件、对象、大数据多协议接入以及多协议关联统一管理,满足多应用跨不同协议实现高效的数据互通访问。
该报告明确了分布式融合存储的四大关键技术:统一存储池,保证数据能够均衡地分布在各个存储节点中,支持存储池的横向扩展,以及数据自动修复能力;存储服务融合,在一套存储系统中同时提供文件、对象、大数据和块存储服务,同时具备丰富的多协议支持能力;数据管理融合,采用统一的非结构化数据和元数据管理架构,保证各协议的原生访问;存储协议融合,支持NFS、CIFS、HDFS、S3等非结构化数据协议的融合互通,保证了各种协议共享同一份数据和元数据。分布式融合存储通过对底层硬件资源进行高通用性且细粒度的管理,可极大地缓解智算时代数据急剧增长所导致的存储资源紧张问题。
分布式融合存储架构
为 五大典型 场景提供 强 大 存力 支 撑
分布式融合存储在海量多源异构数据处理和“通信、感知、计算”一体化的边缘场景方面提供了强有力的存力支撑,使其能够满足不同场景对于存储的需求,为当前的数字化转型时代提供了高效、多维、贯通和定制化的生产要素,让数据驱动向全场景渗透。
《报告》总结了分布式融合存储的五大典型应用场景:
● 以自动驾驶为代表的深度学习场景:自动驾驶场景中数据量比较大,并且数据类型复杂。在整个数据生命周期中,根据不同阶段的应用,需要使用不同的协议。而分布式融合存储则实现多协议互访互通,并具备极致聚合性能,能够满足数据采集、数据标注、模型训练对于存储带宽、小文件处理、存储 IO 等方面的要求,使业务流程更加简洁高效;
● 以 AI/AIGC 为代表的大模型应用场景:模型的训练是AI开发的核心,这要求存储系统提供高带宽和高并发性能。分布式融合存储可避免因访问协议不同造成的数据拷贝,并提供海量多源数据、高性能、低延迟的存储基础设施,为AI应用的训练和推理提供强大存储能力的支撑;
● 以湖仓一体为代表的数据智能应用场景:湖仓一体的架构,数据来源多种多样,面向的服务和存储协议多种多样,所以融合存储是必然趋势。分布式融合存储为该场景提供了更高的计算扩展性,可为各类计算引擎同时提供存储需求,并实现协同合作和数据共享;
● 金融 风控场景:金融风控场景的特殊性意味着,其对于存储系统的可用性、数据一致性、可扩展性、数据安全性、性能都提出了很高的要求。分布式融合存储通过高可用、高安全、高扩展、高性能设计,能够支撑系统实时数据访问和灵活扩容,满足大规模数据存储与分析的需求;
● HPC高性能计算场景:在高性能计算领域,分布式融合存储技术的应用作用愈发重要,它通过将多种存储业务资源集成为一个整体,以满足对文件、对象、块功能的需求,以及性能和容量的要求,并提供高可靠性和可扩展性,为科学计算和数据分析提供了可信赖的数据基础。
分布式融合存储正成为用户首选的存储底座
《报告》预测,分布式融合存储这一新兴技术目前正处于发展早期阶段,仍面临多服务融合的高性能挑战,新存储形态的标准化挑战和智能化的运维管理挑战。
同时,分布式融合存储拥有广阔前景,首先分布式融合存储有助于“存力”构建,符合政策方向;其次,分布式融合存储在一套存储架构有效组织管理不同存储介质、存储协议和存储服务,使得“一套存储架构支持一个数据中心”成为可能;以AI大模型为基础技术,未来涌现的各类新应用需要更强大的数据基础设施和数据平台能力,带来不可估量的市场空间,注定分布式融合存储未来大为可期。
存储产业技术创新战略联盟秘书长李仁刚提出,“云计算、大数据和人工智能等技术的快速发展,将推动分布式融合存储的进一步应用、推广,成为越来越多行业用户的首选存储底座。”