青云存储QingStor U10000:撑起算力半边天,释放海量非结构化数据价值
“越来越多的人意识到,只是简单地把这些海量数据存起来,其实并没有发挥这些数据的价值,或者说静止的数据是没有多少价值可言的,必须让数据流动起来,让数据完整地或者相对完整地经历生命周期的不同阶段,在不同阶段为数字化业务产生不同的价值,才能充分挖掘整个数据的价值。”青云 科技 存储产品总监冯相东表示,如何在数据层面实现“点石成金”正是青云存储多年来的一个研究方向,而量化生活的背后实际上体现出了一场数据形态的变革,青云存储QingStor U10000则正是为此孕育而生的产品。
量化生活背后的数据形态变革
除了随时随地给出建议的可穿戴设备外,很多用户也发现自己的体检报告也正在发生变化,除了预约和获取报告都已经迁移至线上系统外,个人体检报告中也可以看到健康的态势分析。这背后恰恰离不开数据分析平台的支撑。
与此同时,医疗机构自身也需要对于大量的数据进行安全妥善的处理。比如个人用户产生的CT、核磁、X光等典型的PACS系统的数据调取、长期留存场景。根据医疗行业规定,门诊数据保存不低于 15 年,住院数据保存不低于 30 年。这些不断累计的数据对如何存储产生了挑战。
上述数据的爆发式增长,也反映出了计算形态的演变。数据的量级正在飞速增长,例如一家智慧工厂每天产生的数据量都可以达到 PB 级,一辆自动驾驶 汽车 满负荷做测试的情况下,每天可以产生的数据量可以达到数 TB 甚至数十TB。同时,这些典型的自动驾驶、物联网、AR、5G场景背后所产生的数据类型主要以非结构化数据为主,包括图片、音频、视频,以及一些日志类的数据。
AI的机器学习更是进一步提升了对于“海量小文件场景”下的存储性能需求,通常情况下,一次训练的文件数量要到几亿乃至十几亿的量级,每个文件的大小通常在几十KB到几MB之间。但也正是通过这样的学习过程,才能有了可穿戴设备所能给出的精准量化生活、无人超市中的智能结算、自动驾驶的物体辨识,以及体检报告中的健康态势分析。
国内著名的体检机构慈铭体检就通过统一影像存储平台来打破信息孤岛,青云为该医疗集团业务的承载提供了云易捷超融合平台——“轻量级算力平台+青云存储”的方案,为数据的调取、PACS数据的长期存储实现了方案性的改进。平台底层为QingStor 高性能块存储平台,实现PACS系统数据的实时调取和长期存储,其他业务系统则通过与U10000的对象存储做对接,并正在探索基于U10000 协议互通的能力,实现对象和文件可互通,与 AI医疗相关的应用能整合出更多的价值。
实际上,在其中发挥重要作用的U10000正是青云通过全面升级,面向海量非结构化数据平台的存储产品。
面向海量非结构化数据的U10000
青云存储QingStor U10000是一款面向非结构化数据场景的存储产品,主要包括各种影像数据、音视频数据、数据湖、大数据、物联网等场景,同时提供对象、文件、大数据接口,不同协议之间实现数据无损访问互通;单存储桶支持 100 多亿个对象,并且性能不会随之下降。
“产品设计初衷就是帮助客户更好实现海量数据的价值挖掘。”青云科技存储产品总监冯相东表示。除了上述提到的慈铭体检的案例外,某智能自动驾驶科技公司也正在使用QingStor U10000来提升对于海量地图数据中的分析效率,同时还通过集群私有化满足了地图采集数据的监管需求。苏州华兴源创则通过部署包括 U10000 在内的青云全栈存储能力,构建数据存储中台,助力提供工业自动化测试设备的整体解决方案。
青云存储QingStor U10000能够实现对于多个行业的助力,彰显了作为一款全面升级型产品的实力。其继承了原来青云对象存储、文件存储的所有能力,并且在多个维度上实现了产品力的增强和迭代。在实现数据协议的互通、功能和性能的增强、算力平台对接的强化三个方面实现了明显提升。
也就是说,U10000实现了对于文件、对象的统一,在产品架构上可以优势兼得,结合协议互通的特性,用户可以实现数据接驳,在文件、对象、大数据之间做流转。“我们把文件和对象揉合起来,客户的体验上会好很多。”青云科技产品技术解决方案总监张忠华表示。
从架构上看,U10000主要包含三大模块:一是接入服务层,以文件、对象、大数据三种接口的形态去承载多种业务的使用,支持兼容标准POSIX访问语义和标准的SMB接口、NFS接口,同时提供标准的对象 S3 和大数据访问的 HDFS 接口;二是存储服务层,提供丰富的高级功能特性、多维度资源管理功能以及核心机制,比如纠删码、多副本数据安全的机制;三是拥有了一个统一的运维管理平台,为运维或者使用者提供友好的可视化管理界面,实现对存储集群的各种配置、操作和监控。
更值得关注的是,U10000产品在不同维度上均有着极具优势的特点表现,进而为其能在多个行业领域发挥重要作用提供了保障。
撑起算力半边天
“存储是构成算力的一个非常重要的部分,或者说算力的一半要靠存储。”青云科技产品技术解决方案总监张忠华表示,青云的基因是算力,所以对于软件定义存储的思考一定不是孤立的,会把核心聚焦在如何满足算力对存储需求的维度上,让存储更好地为算力做赋能。
这不禁让人想起了曾经PC电脑刚刚用上SSD的时代,确实给当时机械硬盘时代的用户带来了前所未有的体验升级。对于云业务而言同样如此,U10000的一个重要特点就是保障卓越性能,并支持海量数据存储。可为海量小文件场景提供卓越的I/O性能,单桶单目录能支持百亿级小文件存储,并且能做到性能不衰减。同时线性扩展保障了性能和容量的线性增长,用户还可根据业务需求进行灵活的EC配备,得盘率最高可达90%以上。
通过多协议无损互通,U10000还实现了数据访问和流通的高效。其在技术层面提供了统一的索引架构,好处在于让存储和读取数据中间无需格式转化,无性能和语义损失。在存储接口方面,支持POSIX、SMB、NFS、FTP、HDFS、S3、SDK等多种协议,满足常见应用,协议的互通也让数据分析更高效。这种无损互通的优势能在自动驾驶、基因测序的场景中大大提升效率,正常情况下一份数据需要四个环节的处理才能发挥其真正的作用,数据在不同的环节通过不同的协议进行处理,通过协议的互通大大提升了数据分析的效率。
QingStor U10000还拥有一整套完善的对接机制,提供一系列完善的API、SDK,可以轻松地对接大数据平台、数据处理的框架和服务,实现数据和算力的高效结合,涵盖常见的图片处理、音视频转码、AI大数据分析、HPC超算平台、数据备份存档等应用。
对于目前同样备受关注的数据安全问题,U10000能够从元数据和存储数据的分层设计、多重访问安全机制、智能预警机制、功能服务的运维监控平台四个维度来保障用户的数据稳如泰山。
此外,QingStor U10000还是真正自研的中国存储。全部为自主设计,没有继承任何开源的架构,不存在任何知识产权的风险。青云存储也完成了对于一系列国产化生态的匹配,包括从底层的国产芯片、OS、上层PaaS以及SaaS应用,保证了客户在涉足一些敏感数据业务时满足监管要求,且没有后顾之忧。
“是金子总会发光”与“掘地三尺有黄金”作为脍炙人口的话语总是被人反复提及,数据的金光已经闪现,但需要有好的工具才能不至于在还有“三尺”的时候遗憾放弃。算力保证了业务“掘金”数据的效率,QingStor U10000则撑起了算力的半边天,让数据实现“点石成金”。