海兰信海底数据中心科普之可靠性篇

砍柴网 • 2年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

21世纪以来,人类进入开发海洋资源和利用海洋战略空间的新阶段，海兰信依靠海洋与船舶领域超20年的技术积累与沉淀，创新性的将海洋工程与IDC技术相结合，海底数据中心孕育而生。

海兰信海底数据中心科普之可靠性篇

早在2011年，美国互联网服务提供商AOL公司就宣布推出ATC的小型无人值守数据中心，称之为“熄灯”数据中心(Lights Out Data Center)。根据波洛蒙研究所的报告，人为错误是导致数据中心故障的罪魁祸首之一。更加糟糕的是，机房的部署环境虽然适宜人类工作，却不是设备运行的理想环境，其他相应的配套设施，也需要大兴土木，投资甚巨。

人力运维就像是把双刃剑，“熄灯”数据中心意在解决这个矛盾。随着技术进步和运维流程的革新，尤其是在世纪疫情的大背景下，“熄灯”数据中心的理念再次被提及，无人运维的理念逐渐深入人心。更可靠的设备，更精准的监控，更智能的自动化运维工具，让这一些都变得可能。

海兰信海底数据中心科普之可靠性篇

海底数据中心(UDC)，就是这样一种免运维或少运维的数据中心部署形态。那么，海底数据中心又是如何保障系统的可靠性呢?

云服务的可靠性已提升到极致

海兰信海底数据中心科普之可靠性篇

近期，阿里云公布了最新的云服务器ECS服务等级协议SLA，单实例的可用性从99.95%提升至99.975%，多可用区多实例可用性从99.99%提升至99.995%，均为全球最高水准。99.99%的可用性，意味着云服务器一年内故障时间不超过52分钟，多可用区多实例则不超过26分钟。

阿里云是怎么实现这么高的可用性的呢?

首先是计算虚拟化层面的热迁移技术，它保证云服务器在发生故障时可以在用户无感的情况下，迁移到新的云服务器;其次，人工智能模型驱动的自动化运维平台，可实现高效的预防性维护，快速故障隔离，最小化影响面。

存储服务，其中云盘三副本，对象存储纠删码，基于合理的冗余和快速恢复技术，实现了99.999999999%(12个9)的可靠性和99.995%的可用性。

软件定义网络SDN技术已经非常成熟，部署在高可靠的物理网络设备上的Overlay虚拟网络，为业务提供了极大的灵活性和可靠性，远程运维更加更加便捷。

当用户把业务部署在云上时，就意味着将复杂的物理世界的事情留给了公有云厂商，系统的可靠性得到了保证。

后摩尔定律时代，服务器更耐用

1965年戈登·摩尔提出摩尔定律，距今已经过去近60年，芯片制程技术越来越接近物理的极限。

Intel CPU产品演进，从18个月的周期，延长到Tick-tock两步走的两年，又延长到三步走的三年。成本和时间的投入，相比CPU升级换代带来的算力提升，慢慢变得无足轻重。

可以预见，在更长的生命周期里，服务器提供的算力不会轻易遇到技术上的瓶颈，服务器更新的周期将更长，稳定性也将有所提高。

惰性气体环境，故障率低80%

研究发现，引起电子元器件故障的原因中，氧化占30%，温湿度变化占30%，其余为人鼠灾害。

在海底数据舱内，充满了惰性气体，消除了氧化风险;在20米以上深度的海水包围下，配合可靠的液冷散热技术，数据舱不会“中暑”，舱内环境近乎恒温恒湿。

在这样的环境下，服务器的各个元器件都工作在相对理想的环境下，可靠性和稳定性得到大幅提升。

根据微软海底数据中心项目的测试数据，运行在海底数据中心内的服务器，故障率仅为陆地数据中心服务器的1/8。

最近国外IT大厂又出圈了，Oracle和谷歌在伦敦的数据中心，因为高温天气冷却系统出现故障，进而导致机房故障!运维的同学真是操碎心了，想来还是下海吧……

随意打赏

微软成为今年英伟达Hopper产品最大买家，电力供应限制数据中心发展

砍柴网 • 2天前

今年英伟达发布了新一代基于Blackwell架构的数据中心产品，原计划在2024年第四季度开始大规模上市。不过随后生产上出现了一些问题，导致较低的良品率，为此英伟达和台积电（TSMC）花了一些时间解决，从而影响了出货进度。由于市场对当前一代的Hopper架构产品需求依然强劲，2024年内仍然是英伟达数据中心产品线的出货
维谛技术：如何让贵州医科大学数据中心迁移0业务影响？

砍柴网 • 3天前

搬家是什么感觉？麻烦，累，折腾……而且稍不留神就会丢三落四。普通人搬家尚且如此，那数据中心“搬家”会更让人崩溃，过程会涉及大量设备、重要数据和核心资产的转移。贵州医科大学就经历了这样的大场面 ——数据中心迁移做到了高效、快捷，甚至“无感”，而且实现了PUE﹤1.25的节能目标。如此顺滑的数据
最高 61TB，SK 海力士开发出 AI 数据中心固态硬盘 PS1012 U.2

砍柴网 • 3天前

12 月 18 日消息，SK 海力士今日宣布，该公司已开发出适用于 AI 数据中心的高容量固态硬盘产品 PS1012 U.2 （以下简称 PS1012）。 IT之家注：U.2 是固态硬盘的一种形态，是 2.5 英寸大小的 SSD，主要用于服务器、高性能工作站。 SK 海力士表示
谷歌与能源公司携手，未来数据中心将建在太阳能和风能发电场旁边

砍柴网 • 10天前

12 月 11 日消息，谷歌宣布了一项“首创”的合作，将与开发商合作建设由现场可再生能源供电的数据中心。谷歌与能源公司 Intersect Power 和投资公司 TPG Rise Climate 合作，计划在本十年内投资 200 亿美元（IT之家备注：当前约 1451.2 亿元人民币）在
阿里云回应数据中心失火事件

i黑马 • 10天前

有网友12月9日发布视频称广东河源源城区阿里巴巴云端数据库发生火情，现场燃起大火，浓烟滚滚。12月10日，阿里云官方回应称：经核实，昨天下午2:43，河源一处在建园区（未投入生产），总包施工过程中，切割产生的高温铁渣导致楼外的几块挤塑板着火，引发浓烟，火情在约10分钟内用水带扑灭，未造成人员伤亡和财产损失。该在建园区与
官方回应阿里巴巴云计算数据中心失火：已扑灭，现场无人员伤亡

砍柴网 • 11天前

12 月 10 日消息，有网友昨日发布视频称广东河源源城区阿里巴巴云端数据库发生火灾，视频画面显示，现场火势猛烈，浓烟滚滚。视频发布者称火灾发生于昨日下午，有几百号人向外逃生。据都市现场报道，广东河源源城区委宣传部工作人员证实确有此事，火灾发生于源南镇辖区内，昨天下午 3 点左右，大火已被扑灭，现场没有人员伤亡。
百奥亮相CDCE国际数据中心展，与您共探温湿度科技新纪元！

乐购科技 • 12天前

12月5日—7日，“CDCE2024国际数据中心及云计算产业展览会”在上海新国际博览中心隆重举办，同期举办的还有上海EP电力展、ES储能展，吸引了数据行业供应链企业和行业专家齐聚一堂，百奥作为环境温湿度领域的领跑者企业，携数据机房领域多款精密温湿度控制设备及解决方案亮相W5H21展台，受到业界广泛关注。 01数据产业
Meta将在路易斯安那州新建巨型AI数据中心

i黑马 • 15天前

当地时间12月5日，Meta表示将耗资100亿美元在路易斯安那州东北部建造一个新的巨型AI数据中心。路易斯安那州的共和党州长Jeff Landry称，该州不断扩大的科技行业有望“改变游戏规则”。不过这一举措引发了一些环保组织的担忧，他们声称，拟议的数据中心可能会依赖化石燃料，尚不清楚支持该中心的新发电计划是否会推高路易
扎克伯格豪掷 100 亿美元，将新建 Meta 史上最大 AI 数据中心

砍柴网 • 16天前

12 月 5 日消息，据路透社报道，Meta 周三宣布，将投资 100 亿美元（IT之家备注：当前约 727.47 亿元人民币）在美国路易斯安那州建设该公司全球最大的 AI 数据中心，该中心将专门处理支撑数字基础设施所需的海量数据，包括人工智能相关工作负载。这一决
100亿美元！扎克伯格要建Meta全球最大AI数据中心

砍柴网 • 16天前

Meta 北京时间12月5日，脸书母公司Meta周三宣布，计划投资 100亿美元(约合726亿元人民币)在美国路易斯安那州建立一个人工智能(AI)数据中心，这将是该公司在世界上最大的AI数据中心。这座超大型数据中心将位于里奇兰教区，旨在处理支持数字基础设施所需的大量数据，包括AI工作负

评论