对话星辰天合王豪迈:对存储系统的优化永无止境
数据管理,已经成为了当前企业效率的重要指标之一。
数字经济的不断发展,以及先行者的经验让现在大多数企业清晰的认识到,数据只是存起来是不行的,而是需要将数据用起来挖掘出数据存在的价值。
因为他们发现,那些以大数据为驱动的公司,往往更容易获得客户资源,也更容易提高市场份额。
这一理念的更新直接推动了企业内部IT架构、特别是存储系统的向前发展,SDS(软件定义存储)/HCI(超融合架构)逐渐开始取代传统企业存储系统(TESS)。
根据IDC中国的统计,2020年SDS/HCI的最新份额是42.4%,渐渐开始和传统企业存储分庭抗礼。
而对于中国市场,IDC在2017年预测,到2020年中国SDS市场规模将达到40亿。而在随后的2018年,IDC上调了预期,预测2020年国内SDS市场规模会达到64亿。
事实上,IDC虽然每年都在上调对于中国SDS市场规模的预期,最终2020年中国SDS的市场规模还是超乎了所有人的想象,达到了107亿。而这背后,则离不开那些一直在深耕SDS市场的企业的努力。
也就在近日,雷锋网与星辰天合CTO王豪迈展开了一场深度交流,共同探索中国企业如何在SDS领域,打造自己的优势?
如何摆脱“宿命”?
我国《十四五规划》中,将超大规模分布式存储技术创新列在数字经济重点产业云计算专项的首要位置。
回看分布式存储技术的整个发展,在诞生之初就被视为是未来存储的发展方向,其中最为人津津乐道的就是EMC收购了以色列软件定义初创公司ScaleIO。
在XSKY成立之时,戴尔斥巨资收购全球最大的数据存储公司EMC,而这也被业界视为软件定义存储时代到来的标志。
“星辰天合过去是一家以SDS分析存储为主切入市场的,然后一直围绕着客户的需求不断的打磨产品”王豪迈说。
“在此之前,很多公司都是一套业务选择一套存储,但由于软硬件无法解耦,往往都是对象存储所使用的设备,刚上的文件系统就无法使用。”
这直接带来的就是,用户往往需要付出很高的成本来为存储买单,而这也正是星辰天合选择软件定义存储这条赛道的重要原因。
在星辰天合看来,软件定义存储具有的三大优势,必将会让其成为未来存储的最重要的形态,而这三个优势则分别是:
-
可以通过存储系统实现不同品牌硬件设备的共通、兼容;
-
打破传统存储技术的局限,通过分布式技术实现存储容量线性扩容,规避数据转移成本及风险;
-
开发成本低、开发周期短,能够根据实际市场情况增添各种混合功能。
2017年星辰天合发布了分布式统一存储平台XEDP后,舆论却发生了两级分化,一边“一个数据中心一套存储”成为各厂商追逐的目标,而另一边,传统存储厂商抨击:“存储就是通用服务器加软件——这是谎言”。
而在国外市场,刚刚冒出头的SDS厂商的宿命也都是被传统存储厂商收购,而被收购之后,往往也都被市场逐渐遗忘。
如ScaleIO在2013年被EMC以2亿美金收购,虽然当时风光无限。但当EMC被Dell收购后,ScaleIO就慢慢退出了市场。先改名为vFLEX OS,现为PowerFlex,仅仅作为Dell EMC PowerFlex 软件定义的基础架构平台的一部分,配合Dell的硬件捆绑销售。
想要摆脱这种宿命,在王豪迈看来,就必须要不断的打磨产品,在容量、成本、以及性能的三者中,都能够平衡的一款产品。
同时他们也定下了一个目标:在存储入口要满足大部分公司的存储需求,说白了,XSKY必须要覆盖到绝大部分行业的协议支持。
而这也让他们更加坚定了软件定义存储这条道路,因为软件通过更新,可以不断的实现这个需求。
如何用一套存储覆盖所有场景?
“让用户用一套存储覆盖所有的场景。”这是星辰天合这家公司在Day.1就决定要做的事情,这也是业界对于存储未来发展所达成的共识。
在产品层面,星辰天合打通了各个产品的壁垒,让用户可以轻松购买业务所需要的存储产品(块存储、文件存储、对象存储),只需要简单的license控制跟配置控制就能实现全链转化。
但对于所有行业客户而言,高可用性、高稳定性、高一致性是亘古不变的话题。这也正是需要星辰天合等存储产商真正需要解决的问题。
“我们XSKY一直在提升SDS的得盘率、性能、扩展性、通用性,以便SDS适合更多场景。”
在王豪迈看来,想要在相同可靠性的情况下,得到比三副本更高的得盘率,需要使用Erase Code(纠删码,简称EC)。三副本的得盘率是33.3%,EC 4+2的得盘率是66.6%,EC 8+2 的得盘率是 80% 。
但需要注意的是,EC的优势是高可靠性、高得盘率、大块顺序读写性能高,但缺点是小块随机读写性能较差。
在了解之后,星辰天合从2016年开始瞄向了EC。
“在2016年,我们XSKY SDS产品的存储池就开始支持EC,先让我们的用户享受到EC的实惠。”
但受限于EC的特性,对于块和文件存储,星辰天合只是建议在监控和备份场景中使用EC存储池。
针对于对象存储的特点,星辰天合则开发了对象存储小文件归并功能,使之成为EC的绝配,两者组合不仅带来高可靠性、高得盘率,也带来了高性能的小文件读写能力。
而为了让块和文件存储也能使用EC,随后在2019年,星辰天合推出了Boost存储池功能。
王豪迈介绍,Boost存储池采用全局分层缓存架构,其中数据层可以使用EC,同时Cache层使用三副本提供高性能的读写能力,这使得Boost存储池可以用于块和文件存储的大部分场景。
而这也达成了星辰天合的预期目标,但王豪迈对雷锋网表示,对于存储系统的优化是没有止境的。
星辰天合至此也将目标瞄向了,高负载场景下的Cache层。
王豪迈解释到:当Boost存储池的Cache层被业务写爆时,需要把Cache层中的脏数据全速回刷到数据层中,回刷速度就决定了此时存储系统的整体性能。
假如脏数据都是随机小块IO,那么在回刷的时候,数据层的HDD承受的压力也是小块随机写IO。HDD的小块随机写性能不高,只有100+的IOPS,所以整体回刷速度不快,瓶颈反向传导,这就导致此时前端业务也只能以相同的速度写新数据到Cache层中。此时:前端业务写性能 == 回刷速度 。
如何才能快速的回刷脏数据,不断腾出Cache空间,减小对前端业务性能的影响?则成为了星辰天合接下来的目标。
他们发现,在回刷脏数据时,使用大块顺序往数据层的HDD写,回刷速度一定非常高,因为HDD的大块顺序写带宽能够达到80MB/s以上,能够至少包含20,480个4KB小块数据,回刷速度比之前提高了20+倍。
基于这个发现,星辰天合又对Boost架构进行扩展,并在这个月中旬进行了发布,就是XSKY XSpeed架构和功能。
王豪迈介绍,XSKY XSpeed的核心是LogAppend模块,可以把随机小块写IO聚合成大块顺序写,然后再回刷到数据层中。数据层的大块顺序写性能很高,所以可以快速把脏数据回刷到数据层,腾出Cache空间给前端业务使用。
LogAppend模块不仅聚合随机小块,而且还对数据进行压缩和重删,为用户节省更多空间。同时,由于XSpeed的LogAppend模块是在Cache层中实现的,所以块和文件存储都可以使用XSpeed功能。
据王豪迈表示,在发布之前该产品架构和功能已经在用户场景得以应用,通过实践得到了印证。
而为了保证系统的日常稳定运行,让故障防患于未然,星辰天合打造了亚健康2.0监控工具,引入数学模型和统计框架,分析导致系统性能降级的部件级故障和周边系统故障,实现对亚健康网络和磁盘亚健康的监测,对故障部分进行主动隔离,提高系统的健壮性。
性能和成本,另一个永恒不变的话题
在存储领域,介质革命一直都在持续不断的进行,而在这背后的核心就是性能与成本的博弈。
其道理很简单,SCM、SSD等闪存介质可以为用户带来高性能的同时,往往也都让用户的成本居高不下,因此很多用户只会在核心业务中选择闪存介质的存储来支撑。然而对于用户而言,对于存储性能是一直都无比渴望的。
毫不夸张的说,所有做存储产品的厂商,都一直在死磕闪存介质带来的高成本,但从结果来看,收效甚微。
面对所有厂商都在面对的难题,星辰天合则选择在最近发布的全闪存XINFINI星飞选择使用QLC SSD支持TLC/Optane + QLC SSD分层,兼顾高性能与低成本。
王豪迈对雷锋网表示到,QLC SSD的成本只是HDD的2倍,但是在整个性能上基本上不是同一个量级,在读的性能上QLC SSD是HDD的500倍,读与写是25,时延只有1/10多一点,可靠性上面也更高,功耗上只有过去相同流量的功耗的1/3。
唯一的问题就是QLC不能做很长时间擦除写的能力,所以QLC的壁垒在于DWPD的障碍,XSKY在DWPD障碍上面会进行率先解决,实现QLC SSD的在真实的企业数据环境里提出问题。
除此之外,王豪迈也表示对于QLC带来的小块随机写寿命问题,XINFINI通过XSPEED的技术把小块随机写变成合成为大块顺序写,同时通过EC技术能使得QLC更好的用EC,将成本进一步的下降。
综合来看,相比于业界主力全闪存产品,XINFINI星飞在数据读写性能方面超过50%,而硬件成本则下降40%。
对此王豪迈也坦言,目前市场上对于QLC的认知还很低,因此在很长一段时间,星辰天合都会选择采用一体化交付模式,只有当QLC SSD真正的走进了千家万户,才能够完全的实现软硬件解耦。
除了介质革命之外,星辰天合也在积极推动存储市场的下沉。
“我们要为大型政企机构提供更专业的技术、产品和服务,也要为广大的下沉市场提供更加便捷、优质的数据服务。”XSKY星辰天合COO翟静近日在发布会上表示,中国2000多个区县每天产生着海量的数据,成为中国数字化转型升级的中坚力量。而下沉市场更需要自助式管理,便捷运维,快速无缝扩容的数据存储和管理。
对于这一需求,星辰天合还发布了订阅模式下基于云边协同架构的数据管理服务,降低客户获得数据管理服务一次性购置费用,实现“随需使用、所见即所得”的使用体验,灵活自如地使用最新的技术架构及应用服务。
而对于下沉的市场的潜力,目前行业的认知依旧有限,有报告称,自2018年后线城市数字产业指数持续发力,其中,数字五线城市增幅达216.57%,大幅领先数字一、二线城市。
由于先行一步,星辰天合的技术、产品和服务已覆盖全国40多个重点城市,占据了先机。
洞察行业需求,深入数据全生命周期
IDC预测,2025年,全球数据量将达到175ZB,5年年均复合增长率31.8%,而数据中心存储量占比将超过70%。与此同时,软件定义存储市场也不断超预期发展,整体市场规模将超千亿。
除此之外,新基建也对于数据存储提出了更高的要求,随着数字化转型的不断深入,行业用户的对于数据已经不再只是满足将数据存起来,同时也要将数据用起来。
“软件定义存储,既是创新设施,也是融合设施,更是信息基础设施。通过软件定义的方式,更好的适配开放芯片和硬件,分布式的承载海量数据,并做到数据的长期保存,为数据资产化做好底座。”
在星辰天合CEO胥昕看来,在云边协同的技术趋势下,新基建带来的海量结构性数据和非结构性数据,离不开弹性、解锁、可持续的软件定义存储平台做数据承载支撑。
“我们不仅仅做产品、设备的供应,更要提供数据基础设施,以此帮助客户建立数据资产平台,把数据汇聚起来,存好、管理好,最终利用好,实现数据常青。”
这一洞察之下,星辰天合开始与国内头部云厂商对接,打造混合云时代云-边-端的数据存储与管理协同体系。并形成了“汇存管用”为核心的未来产品发展矩阵。
而在此产品发展战略之下,星辰天合看来也可以积极把握住国内信创机遇,大力发展国产自研的核心技术。
对此,中国长城科技集团解决方案部湖南技术中心总经理高晓飞表示:“长城云深度融合XSKY星辰天合分布式存储系统,为客户构建业务驱动的信创IT基础设施。同时,飞腾 CPU 通过与软件定义存储产品完成系统性的互验证与适配,进一步优化一体化系统技术,有效提高相关产品的交付效率,增强关键信息系统基础设施的国产化进程。”
而据雷锋网 (公众号:雷锋网) 了解,在去年星辰天合就推出国内首款信创SDS存储产品天合翔宇分布式存储系统,并完成了近20家国内核心信创生态伙伴的生态适配。目前,星辰天合的信创生态合作伙伴已超过50家。
中国基础软件革命仍在继续
得益于数字化转型的加速,我国企业在中国基础软件领域,正在突破大家传统的认知,从以前的不敢想,到现在产品从可用走向了好用,这背后离不开这些公司的创新发展。
尤其是在存储行业,作为数字化转型的基础底座,SDS纯软形态具有特别的意义,特别在信息创新方面。因为目前的服务器和操作系统的信创平台相对完善,如市场上有很多鲲鹏、飞腾、海光的服务器、再搭配麒麟和统信的操作系统,加上一个适配多种信创平台的SDS软件,就可以轻松实现存储的信创。并且由于SDS的架构优势,可以让用户从非信创生态平滑演进到信创生态。
可喜的是,我们看到,在这条道路上已经有星辰天合这样的公司,在努力前行,并推动着产业以及生态的发展,从根本上保证这着我国数据的安全。
。