顺应新基建浪潮,看超级大行360°玩转服务器智能运维
【导读】随着 互联网金融 的快速发展,数据中心规模越来越大,设备越来越复杂,传统运维模式无法满足当前业务需求,为了解决运维困境,某超级大行引入浪潮ISPIM服务器管理平台,ISPIM凭借资产信息自动录入、监控指标精细化管理、故障诊断专家大数据规则库、异构设备统一管理等功能,帮助该行数据中心运维效率2倍提升,保障业务稳定可靠运行。
近年来, 互联网 金融 快速崛起,传统银行不断转型升级,推出各类线上金融产品,引入智慧化设备,无纸化办公、远程金融交易等等,海量数据实时交易对银行的信息系统也提出了更高的要求。信息技术在银行系统扮演的角色越来越重要,各大银行纷纷把构建安全、稳定、有序、高效的IT运维管理模式,推动业务系统稳定运行视作增强自身竞争能力的关键一环。
传统运维模式跟不上业务快速发展的脚步
随着企业业务量的不断增长,数据中心的规模越来越大,而大规模的异构厂商设备难以进行统一监控和管理,企业运维压力不断攀升。传统运维模式严重依赖“人力”,运维人员即是数据中心能力的瓶颈。例如,数据中心新设备上架后的资产登记工作、服务器移动后的资产信息变更统计工作、年终机房设备的盘点、数据中心的报表整理等均需要以人工的方式进行维护,工作量较大、容易出错。
而随着银行数据中心服务器保有量的不断增加,设备告警泛滥、缺少融合,而且告警的设备在发生问题后,很难在第一时间得到处理。在面对故障修复问题时,传统运维模式大多依赖于人的经验判断,而面对大量复杂的异构设备,运维人员难免判断失误。
传统运维与精细化管理是矛盾的,传统运维模式无法单独对服务器的功耗进行实时的监控和统计,只能通过供电设备对整个机房(包含空调、照明、服务器等)耗电进行统计,能耗管理粒度粗。
告别传统模式,浪潮ISPIM助力金融行业运维转型
为了能够提升服务器运维水平和运维效率,解决传统运维模式当前面临的挑战,某银行巨头近年来将“带外管理技术研究”作为年度课题展开研究,期望通过新技术解决目前运维的痛点,保障业务运行的可靠性。
作为世界TOP级银行,该行数据中心服务器保有量高达数万台,采用两地三中心的容灾方案,支撑着全国的资金管理、收费缴费、金融理财等业务。为了满足当前运维管理需求,解决运维困境,该行引入了浪潮ISPIM来助力运维。ISPIM(浪潮物理基础设施管理平台)是面向互联网、金融、通信等行业数据中心的物理基础设施自动化运维平台,具备资产统一管理、设备实时监控、告警精准推送、设备自动巡检、无状态固件管理、智能能耗分析等功能,可实现服务器、存储、交换机和防火墙等设备的统一管理,能有效地帮助企业提高运维效率、降低运维成本,保障数据中心安全、可靠、稳定地运行。
图1 ISPIM功能架构图
创新运维管理平台,看ISPIM如何乘风破浪
经过对运维需求的考察,该行与浪潮最终决定在该行数据中心使用6台虚拟机,以“主备HA模式”部署ISPIM。在主机宕机的情况下,可以自动切换并启用备机,保证数据中心设备监控的持续运行。其中,主动采集频率为1h,监控指标可达150W+,覆盖了数据中心设备的所有组件。
图2 部署方式
浪潮ISPIM支持资产信息自动录入,能够定时批量地扫描资源,同时自动获取设备的型号、SN序列号、BMC版本号等元数据信息,并支持导出资产报表。7x24小时的服务器部件级监控告警,能够实现全性能指标监控,包括风扇、温度、电压等指标的监控。通过主/被动的监控方式,可以实时捕捉设备异常信息并及时将告警信息推送给运维人员,极大地降低了工作人员的运维压力。
ISPIM内置服务器专家级大数据规则库,拥有主动巡检机制,内置492个故障模型、30,000+专家经验,可以快速诊断故障根因并关联至对应的应急预案建议,自动提供解决方案。支持对服务器性能指标进行阈值设置,实现性能功耗的精准控制。功耗管理功能,用户可以一目了然的查看不同类型服务器的能耗详情,做到“心中有数”,为后期数据中心采购设备、扩大规模等提供参考建议。
ISPIM你值得拥有,改变数据中心运维套路
互联网、移动互联网乃至物联网的快速兴起带动了数字技术的普及,在这一趋势下,数据中心事实上已经成为绝大多数公司的核心生产力和重要资产。与此同时,业务扩张与创新也使得数据中心的规模不断膨胀,以BAT为例,其区域数据中心规模均已步入10万+服务器级别。
浪潮ISPIM可同时对于数万台不同品牌服务器、存储、网络设备等设备的统一监控、运维、告警管理,运维效率2倍提升,基于浪潮故障专家库的大数据规则故障诊断功能,可将故障诊断提升到93%,并且可在快速处理故障的同时最大程度降低数据泄露风险。