医院进入智慧运维时代,北塔软件时刻准备着
假如医院的信息系统崩溃,你是否能接受几十年前的手工运作模式?
答案相信是否定的。
随着信息化手段已成为人们倚重的常态,带来挂号、就医、看诊、检查、缴费等一系列便捷的同时,也预示着IT系统一旦故障,甚至崩塌,医院运转将基本陷于瘫痪状态。
保障医院IT系统免于故障侵袭,当然运维系统责无旁贷。但当信息化建设的脚步越来越快,传统的运维方式是否还能完全掌控?武汉大学中南医院的运维进阶探索之路,同时也解答了这一疑问。
项目背景
武汉大学中南医院(以下简称“中南医院”)始建于1956年,目前为三级甲等医院,开放床位3300多张。随着医院信息化程度越来越高,目前医院信息系统应用也越来越多,重要应用系统已实现高可用性,其中——
HIS 数据库通过两台高性能小机实现高可用性;
应用系统则通过刀片服务器搭建的虚拟化云环境,实现物理架构的高可用及资源的快速匹配调整;
数据存储方面则通过EMC及华为进行存储。
各种新技术的运用使业务运行更加便捷的同时,对业务系统进行运维的IT部门也迎来了巨大的挑战。随着医院信息化的不断发展,IT运维部门也在不断地摸索着更为适合的运维方式,但很多运维工具并未能很好地兼容具有医院特色的运维方式,使得IT运维部门不得不承受技术升级与行业匹配度不够的双重压力,也无法更好地提升管理效率,降低运维成本。
运维挑战
强化主动监控,实现集中管理
将根据现状和需求进行统筹规划,本着“从实际需要出发,保护已有 投资 ”的原则,将目前已有的,针对网络、服务器、安全设备、数据库、中间件、应用、虚拟化、存储的分散式监控管理系统,集中到一个统一的监控系统平台进行监控、告警、性能、展现管理、实现网络、业务资源、业务应用的全面集中监控,构建统一集成的系统资源监控平台,主动、及时地发现问题,解决被动服务的局面。
快速定位故障,减少维护成本
通过统一事件处理平台,收集全部的监控和状态信息,建立集中的告警分析处理机制和故障预警机制,提供自动化的事件处理能力,当故障产生时,可以快速定位故障,很快发现问题根源并找到相应的解决方案,从而缩短故障解决时间,减少维护成本。
提升主动管理、辅助分析决策
利用IT系统集中监控管理平台综合监控管理系统,全面主动反映信息系统的运行健康情况,利用各类性能分析报表、资源统计报表和运维分析报表,从各个侧面、各个角度反映系统的运行情况,性能情况和人员工作情况,为系统升级、改造、扩容提供科学依据。
直观运行展现、快速指挥调度
通过运维管理平台展示系统对医院HIS、PACS等业务核心数据进行分析和实时监控,丰富、科学、美观的展示IT资源运行情况、性能状况等,使领导、管理者、技术人员能迅速了解自已关心的问题。对于IT运行的故障处理过程中,能够通过直观的运行展现,进行快速指挥调度。
解决方案
结合多年医院运维服务经验,北塔软件推出针对医疗行业的解决方案,包含了医疗行业用户最需要的基础监控、业务管理、等保自查、敏捷专线等几个重要部分,也很好地覆盖了中南医院当前的运维需求。
1、 该方案具备很强的综合管理能力
包括实现对超过一百个不同品牌的网络设备进行管理,是目前国内支持厂家最多的运维管理产品。除网络管理外,该方案还支持对服务器各种操作系统的管理,尤其是非Agent方式进行数据采集,能够最大化保障主机安全性,同时支持对服务器主板、风扇、电源、硬盘等硬件资源的监控。方案中核心产品北塔BTSO还是业内最早支持Caché数据库的产品,同时还提供了支持Oracle RAC、SQL等常见数据库的管理。支持对Vmware等多种虚拟化品牌的管理、支持主流存储厂家包括EMC、IBM、NetAPP、华为等不同品牌的支持能力。
2、 内置BSM功能模块,更专业的业务服务管理
帮助用户实现定制化业务管理视图,清晰的业务总图、单个业务运行图等丰富的展现风格,可以更好的管理和支撑业务。
3、 敏捷专线管理功能,加强保障重要网络线路
医疗用户实际应用中都有一些重要的网络线路,比如对外的医保专线、新农合专线、区域医疗共享平台等,对内比如总院和分院之间的线路,网络和服务资源之间的网络线路等。这些线路如果出现异常,比如终端、线路质量出现问题都会影响到业务系统。
在传统运维管理中,对于一些线路的监控往往监控频率是5分钟,考虑到医疗用户实际运维需求,该方案中提供了敏捷专线管理能力,首先将采集时间由5分钟缩短到15秒的采集间隔,采集频率提高了20倍。同时考虑到专线往往都有主备链路,因此同一个线路还提供了主备链路同时检测能力。对于线路质量的判断引入了时延进行分析,对链路实际带宽占用提供了真实的而非网络端口的(比如线路带宽30兆,端口速率1Gbps)的带宽占用比帮助分析。
4、 内置等保自查功能,对标最新标准
医疗行业用户中三级甲等医院要求每年需要通过三级等级保护。在新的等级保护通用标准V2.0的送审稿中,可以看到广泛的增加了较多和运维管理相关联的内容,比如对机房动环有了更明确的要求,对主要IT资源的占用、网络带宽的占用情况、运维流程和资产信息都有了更高的要求。
因此结合前期医疗用户购买运维管理产品时提出的要求,参照等级保护通用标准V2.0送审稿中的具体要求,北塔软件在方案中内置了等级保护自查管理功能模块。
通过自查模块,医院用户可以从运维系统中获取最新等保所需信息指引,通过点击指引,给出了具体的管理页面和内容,这样方便医院用户做等保资料收集工作,可以更好更快地准备好等级保护所需的各类资料。
实施效果
1、自定义首页
2、网络拓扑
3、系统拓扑
4、专线管理