专访丨云智慧总裁刘洪涛:让运维管理更简单、智能
从 信息化 到 数字化 ,这不是文字游戏,而是产业变革。
“信息化”这个词,已经是几十年前的热词了,科技发展到今天,“数字化”逐渐代替了“信息化”,成为新的热门词汇。虽然词汇变了,政府、企业对信息技术的应用确实需要大幅提升。今年的两会上,“新基建”首次被写入政府工作报告,利用新型基础设施推进政府数字化进程,促进信息网络建设,鼓励企业积极转型数智化成为各界关注的焦点。
可能很多人对于信息化、数字化建设了解并不多,不管是政府部门还是企业,一般都设有信息化相关的部门,主要负责机构组织的信息化平台建设、日常维护、数字化转型等工作,提升组织的工作效率。
但是, 数字化转型并不是一蹴而就的事情,而是需要长期的建设和完善。 从传统封闭的信息化架构到互联网、移动互联网、IoT的 万物互联 ,IT管理的边界从企业内部彻底打开,数据量指数增长,对于传统信息化部门来说,想要做好数字化系统的运行维护,几乎是不可能完成的任务。因此, IT运维 管理成为企业数字化转型的一大痛点。
IT运维的痛点可以从两方面理解, 一方面,随着数字化的推进,传统的运维管理已经不能满足当下高数据量、高并发量的需求,经常会导致组织业务不稳定的现象;另一方面,当下的数字化推进过程中,政府和企业更注重数字化基础设施和应用系统的建设,比如:部署公有云、混合云、微服务等,没有足够重视“上云”之后的运维。
在年初的“新冠疫情”爆发期,很多企业出现了严重的数字化运维问题,比如:线上用户量暴增,服务器出现频繁宕机,业务崩溃时有发生,这些都是运维能力不佳导致的,甚至直接影响业务的增长。
“在我们看来,数字化运维还是一个蓝海市场,因为我们跟传统的运维管理商做的是不一样的事情。我们根据现代企业在数字化转型过程中遇到的运维痛点,重新定义了数字化时代的运维管理,我们管它叫 智能业务运维 。“云智慧总裁刘洪涛告诉亿欧。
IT运维市场的新蓝海
IT运维的价值体现在对业务稳定、运行安全和提效降本三方面的保障与控制。 放眼全球,企业为了优化IT运维水平,必须借助运维管理软件来提高自身运维工作效率,节约成本。
2014-2018年中国IT运维管理软件市场规模,来源:信通院
根据信通院统计数据显示,从2014年到2018年的5年中,全球IT运维管理软件市场年平均增长率为7.9%,整体呈持续增长态势。中国IT运维市场同样发展迅速, 从2014年到2018年,中国IT运维管理软件市场年平均增长率为9.15%,高于全球平均水平。
“数字化系统规模、复杂度以及数据应用与监管等挑战,是IT运维行业发展的核心驱动力。目前, 智能业务运维市场正处在拓荒阶段,而且这段拓荒期估计要持续5年。 我们相信,践行数智化的智能业务运维将会成为IT运维行业的未来。”刘洪涛自信的说。
据Gartner预测,以AIOps为核心理念,覆盖IT基础设施监控(ITIM)、应用性能管理(APM)、网络性能监控(NPMD)等领域的智能业务运维市场,将以每年约16%的增幅高速增长,可谓“水大鱼肥”的IT运维新蓝海。
打造 “智能业务运维”旗舰
刘洪涛说:“现在的数字化跟过去是完全不同的, 上一代的信息化是解决内部管理问题 ,比如OA系统、电子邮件等,主要是为了增强组织内部的工作效率,而且这些系统对于组织来说都是封闭式系统,对于运维的要求不高,只需要在某个时间段的时候能够保证系统稳定、安全运行就可以。 而数字化聚焦的是企业核心业务 ,比如电商场景中,有微信营销系统、物流管理系统等等,这些系统都是开放式的,对于组织的IT运维而言,就完全不一样了。这些线上的业务系统,必须时刻保持稳定、安全的运行,否则将直接影响到业务发展,这对IT运维的要求很高。”
在此背景下,云智慧开始专注于围绕数字化系统架构和核心业务,应用大数据、 人工智能 、IoT等前沿技术,着力打造国内智能业务运维市场的旗舰, 帮助企业进行数字化运维体系建设、智能运维管理,持续赋能企业的互联网级运维能力。
云智慧的产品从ITIM、ITOM、ITOA到ITSM,覆盖运维管理的全生命周期,包括:数字化运维监控中心(DOMC)、数字化运维事件管理产品(DOEM)、智能化日志分析(DOLA)、数字化运维服务管理(DOSM)等等。 每个产品解决某一个或者某几个运维场景的需求,但是在实际的运维工作中,难题总是错综复杂、互相交织在一起。 因此,在产品的基础上,云智慧的场景化解决方案更受欢迎,比如:IT分层监控、运维数据治理、业务与IT集中管控等。
保险业效率变革的一角
当然,不同的行业、企业有独特的场景需求。
拿保险行业来说,最近几年,随着业务的不断扩张,无论运营方式还是消费场景都出现了巨大变化, 传统低效的人工服务模式逐渐被高效的数字化方式所取代,电子保单、移动查勘、自助理赔成为消费者选择保险的重要考量因素。数字业务规模不断扩大使得保险行业IT运维面临软硬件数量激增、应用和架构复杂化、变更频繁、运维数据井喷等困难和挑战。
在保险公司数字化系统建设中,传统监控系统的监控广度和颗粒度都无法满足目前的监控管理需求,缺乏自动化技术手段对业务系统实时监控,存在故障无法预警的风险。在技术管理层面,业务系统的计算、网络、中间件及数据库存在大量数据孤岛,导致故障排查困难,不能通过快速定位故障根因,保障数字化创新业务的增长需求。
因此,需要一套符合全新业务理念的一体化智能业务运维管理平台,对基础设施、网络链路、应用系统性进行统一监控,实现基于业务的端到端应用系统性能监控管理。
然而,这种监控管理平台是传统平台无法高效解决的问题, 必须通过重新定义监控管理系统的方式,把问题的核心找到,从而寻找对应的解决方案。 云智慧从以下三个方面做出调整。
首先,部署监测点。 通过全球部署的骨干网监测点节点,特别是国内100多个重点城市的监测点,持续监控微信客服业务场景中区域用户体验问题,以及电子保单用户在投保过程中遇到的页面加载缓慢的问题,及时发现和解决网络性能瓶颈。
其次,收集解决外部客户的使用问题。 通过在移动展业APP、银保通APP、保险服务APP等移动APP上集成SDK,抓取移动端出现的缓慢、错误、崩溃、卡顿等问题,从发现问题到定位问题只需要2~5分钟时间,大大提升了IT部门解决前端用户体验问题的效率。
第三,收集解决内部人员的使用问题。 通过在前端服务应用、保费计算应用、网销应用服务实例上部署Agent方式,实现对微服务每个实例的监控,帮助运维人员更快速、更精确地定位微服务后端的性能问题。
最终,云智慧通过自主研发的专业运维数据库,将多源数据进行统一采集、处理和关联分析,使用数据可视化技术,将统一视角的用户体验及IT系统健康数据呈现给用户,为管理决策提供有效判断依据。
像这样的企业数字化难题还有很多,问题出现的根本原因,就是科技的快速发展、生活场景的不断升级,对原来的旧平台、旧系统带来了巨大的冲击,比如:数据量指数级增加,用户体验需求更加细化和具体,追求更高。
“旧瓶完全装不了新酒,必须从站在新的角度,用更加前沿的技术,思考问题底层的根源,从而找到新的解决方案。因此,从信息化到数字化,背后真正的改变是云计算、大数据和人工智能技术的结合,用领先的技术解决更加复杂的场景化问题。”刘洪涛如是道。
本文来源于亿欧,原创文章,作者:袁帅。转载或合作请点击 转载说明 ,违规转载法律必究。