博言丨保险大数据的痛点、现状、误区、解决之道和挑战
【导读】当今世界正在经历一场伟大的“数据革命”,大数据迅速并深刻地改变着人们的生产生活,正在开启一个崭新的时代!同时,每年5月,在中国贵阳召开的中国国际大数据产业博览会(简称“数博会”)提供大平台,集中展示最新技术及理论成果,齐聚行业相关人士共商大数据产业发展大计。在2018数博会即将召开之际,数据观特别邀请行业专家、学者、企业家深入剖析产业发展现状,推出系列大数据产业深度评论专栏《博言》。今天刊发的文章,是由中关村老李撰写的《保险大数据任重道远》,360°详解了保险大数据的痛点、现状、误区、解决之道和挑战。
从两年前的金融科技,再到保险科技,大数据应用的热点由互联网金融、消费金融领域逐渐渗透到了保险,这是市场发展的必然。作为金融的三驾马车之一,保险本身对数据就是强依赖的,其电子化程度和数据基础都要比很多行业更为良好,数据应用的环境也自然会先成熟起来。另一方面,也不得不看到,保险大数据还尚属萌芽期,谈大数据应用来彻底颠覆传统的保险业还为时尚早,需要时间才能完成内外部数据的融合和赋能。
无论今天的保险大数据是否成熟,大数据究竟能给保险带来什么样的改变?大数据在哪些领域可以发挥作用,发挥什么样的作用?这都是我们首先要弄清楚的问题。
1、痛点与现状
突破发展瓶颈,运营是关键
经过了近二十多年的“野蛮”生长,保险业增速放缓,跑马圈地的时代已经过去。虽然我国的保险业对比国外发达国家还有很大的空间,但目前在保险产品、技术服务等方面的能力不足,阶段瓶颈必然产生;另一方面,随着监管的加严,险资被限制进入理财市场,保险的重心势必回归到保险业务本身上来。
在这样的背景下,要想突破瓶颈,打开进一步上升的空间,就首先要解决好内部矛盾。这个内部矛盾,就是产品、技术、服务等为代表的运营能力。发展和运营一直是公司发展的两个主要矛盾。在螺旋上升的不同阶段,这两个矛盾的重要程度不同,但又相辅相成。在外部增量客户放缓的情况下,做好存量客户的服务,提升运营水平,实现稳中有升,可能是目前比较务实的做法。
简单地讲,运营能力就是在现有的基础上减耗增效。如何依托新的技术和理念,来提高运营能力,突破阶段瓶颈,使保险业进入下一个螺旋上升阶段,就是摆在所有保险管理者面前的课题。
互联网金融、消费金融把传统的信贷业务从线下转移到了线上,从而实现了大部分流程的自动化。保险业是否也有这样的机会呢?如果也能实现部分业务的线上化,自动化,减耗增效的目标就可能实现,运营水平也将得以提高。
决定是否能够将保险业务由线下转移到线上,最核心的一个要素就是能否找到合适的数据来还原业务的场景。从保险的业务流程来看,大致可分为获客、核保、理赔三个主要的环节。无论是获客,还是核保、理赔,在今天都已经初步具备了用数据来还原场景的条件。当然,这些数据目前可能还不够完整(覆盖度和维度),质量还不够高(数据的相关度),还有待进一步优化,沉淀,完善,但相信随着时间的推移,这些问题都将被解决。原因很简单,有刚性需求!
自身的数据基础欠缺,业务数据先天不足
从保险的数据现状来看,虽然多数公司都经历了近二十年的发展,也有很多数据积累,但是由于业务重心的问题,数据质量并不高,还无法直接使用。
除此之外,保险数据同其他行业数据类似,数据因业务所限比较单一,且交易频次过低。多数险种一年才发生一次,很难提炼出有价值的信息,这就给后续的数据分析和挖掘造成了客观上的困难。单纯依靠保险自身的数据,难以完成对业务的更精细化的描述乃至其他动作。
这就决定了保险业如果要想在数据应用上取得良好的效果,需要在优化自身数据,提高数据质量的基础上,引入外部高质量的数据来弥补自身数据的不足。
2、误区
近几年来,保险行业在大数据应用领域也做了一定的尝试,但客观讲收效甚微。究其原因,主要有两个误区,一个是认为“大数据就等于买数据”;还有一个是数据应用的方向不对。
大数据等于买数据
很多保险公司认为他们所缺的只是外部的数据。有了外部数据,依靠自身的力量也可以完成大数据在保险业的应用。
首先,对外部数据的不当引入,会导致法律风险。2017年,我国公布了《中华人民共和国个人信息保护法(草案)》,对个人隐私数据进行了保护。外部数据,尤其是高质量的外部数据,很可能涉及个人敏感信息,需要经过授权和很精细的处理才能使用。
其次,外部的数据应用是属于跨域的数据应用,具有很强的专业性。它既需要了解市场上各类数据的属性(这一点在数据市场还远未成熟,今天由保险从业人员来实现尤为困难)及可能应用的范围,又需要了解如何将数据加工才能满足保险业的需求。并不是每个外部数据的引入都能为某项业务带来明显改善的,也不是经过一次的引入就能取得良好的效果。
外部的数据产生的业务场景与保险行业不同,因而在使用的过程中,就要仔细甄别,不断调整。距离保险业需求越近的数据质量越高,做出的数据产品效果就越好。但无论多近,外部数据始终是外部数据,其产生的环境与保险的需求大多不会100%契合,这就需要专业的数据团队进行加工、处理,经过几个轮回的迭代才可能取得好的效果。所以,跨域数据应用并不是一次性的简单买卖,而是需要有专业化的队伍针对保险的需求,不断地尝试不同的数据品种以及算法调优,才能实现数据产品的目标。
应用的方向不对
在外部数据应用中,还有一个主要的误区就是数据应用的方向不对。生搬硬套别的行业,别的领域的成功经验,是目前很多行业数据应用的普遍现象,保险也不例外。精准营销和用户画像的确是大数据比较典型的应用,但并不意味着每一个行业的数据应用都首先要从精准营销和用户画像开始。
“用户画像”是建立在本身有较强的业务数据基础上来展开的。银行业和证券业做用户画像是基于本身高频次的交易数据基础上,再融合外部数据勾勒出用户的偏好,通过原有的业务触点更精准地为客户推荐最合适的产品,以提高客户在银行或证券业务上的复购率和个人贡献值。这是建立在自身数据基础和业务特点上完成的数据应用,并不一定适合保险。多数保险产品的交易频次很低,本身产生的业务数据量很小,难以支撑用户与业务之间产生强关联原因的精细刻画。我们曾经做过大样本的实验,并没有发现哪个具体的行为特征对用户购买保险产品有确定的影响力。
除此之外,保险产品具有其特殊性,它需要线下面对面的交流。即使通过数据确切地知道某个用户可能有某个产品的需求,如果触达方式不合适,一样不会成功地转化。单纯的“精准营销”在保险行业并不能取得良好的效果。
数据应用过程中生搬硬套的现象也反映了保险客户对数据应用的认知不足,还没有形成业务和技术之间的有效互动,数据应用被局限在技术部门,还没有发挥其应有的价值。这就决定了目前外部数据应用在保险行业还没到全面爆发的阶段。
3、解决之道
大数据知易行难,这是业界普遍公认的,尤其大数据在传统大B行业中的应用更是难上加难。传统行业都有比较健全的业务体系,严格的行业标准,庞大的业务规模,有一套引进产品和技术的规程。这与一般的互联网技术在互联网本身应用有着很大的不同。它要求行业的数据服务提供商既要对大数据有着专业的水平,同时也需要对大型企业有着深入的理解和洞察。
虽然,“用户画像”、“精准营销”并没不一定适合保险行业作为现阶段的应用,但在其它一些领域、一些场景已经可以做出明显的效果。它们或者可以解决原来解决不了的问题;或者可以改善原有的方法,提高效率,降低成本;也或者开辟了新的渠道,形成创新的业务模式。这些都是今天乃至未来可以应用的方向。
当然,我们也必须清醒地看到,受数据成熟度的限制,数据应用不可盲目求大、求快,只能摸着石头过河。
切入点的选择—效果明确
选择切入点最重要的标准就是在现有的内外部数据条件下能取得明确的效果。
外部数据的属性毕竟与保险业务数据属性不同,能否起到好的效果还尚未可知。要从保险行业有明确的痛点,在现有的内外部数据条件下,最可能做出效果的事情开始。痛点的选择也不宜过大,先聚焦在一个环节上甚至某一个环节中的一个具体问题,这样对周边业务牵扯不大,决策也相对简单,也比较有可能做出效果。
数据产品也要从简单的粗加工产品开始,短时间就能取得明确的效果,便于试错。即使方向错误,也可以迅速地调整,逐渐完善。切不可一上来就投入大量的人力物力财力,花很长的时间妄想做一个“杀手级”的产品,一次性解决问题,这样容易犯系统性错误。因为外部数据的不确定性,决定了应用效果的不确定性,要避免犯方向上大的错误。
有些痛点在今天虽然有明确需求,但数据基础不满足,做不出好的数据产品,就要放弃;有些痛点,在今天已经可以具备一定的条件,可以做出明显的效果,这就是我们选择的切入点。
举个例子,高额意外险和重疾险的欺诈损失一直是寿险运营的痛点。高额意外险,在现有的数据基础下,很难找到一个行之有效的数据产品来实现反欺诈,那就暂时放弃;而寿险里的重疾在今天是可以找到强相关的数据来实现反欺诈产品,就可以先从重疾险的欺诈产品开始,作为一个切入点。
反欺诈作为大数据的一个典型应用,与行业业务可以从松耦合开始(既先不考虑行业的场景,仅从身份识别和外部场景入手),最简单的应用就是“验真”,在不需要保险行业做更多的环境准备,不需要牵扯太多部门的情况下,还原业务的场景。这样才能快速试错,快速落地。
可能应用的方向:开源节流
所谓“开源”就是能依靠现有的数据产品或者技术能够找到以前无法识别的客群,这样就带来了增量市场。而“节流”自然就是依靠数据产品和技术来提高原有的效率,降低成本。
开源赋能
举个简单的例子,我国大约有一亿多糖尿病患者,这一数字每年还在增加。按照现有的保险规则,这部分客群是不在保险范围内的。可医学的发展使糖尿病人的生存状态有了本质的改变,很多糖尿病患者依然可以健康地活几十年。如此庞大的一个客群,如果有数据可以支撑对这部分患者进行甄别分级,重新设计产品,制定一个合理的价格,就可以吸纳进一个庞大的客群,形成一个可观的增量市场!
提高效率
在运营方面,随着外部数据的成熟和运用,核保和理赔可以实现部分自动化,甚至全部自动化。这都会大大提升效率,降低运营成本。
尽管反欺诈在保险行业内部也是多年的老生常谈,但由于保险业务数据的先天不足,引入外部数据无疑会使反欺诈变得事半功倍。用数据可以尽可能地还原某人在某地,在某一时刻特定的场景,从还原的场景去发现欺诈者的蛛丝马迹。覆盖保险业务数据原来覆盖不到的时间和空间的事件。
降低成本
外部增量数据的支撑还可以降低人工成本。目前很多健康险TPA公司为了提高用户的体验度,加快报销的速度,不得不依靠庞大的人工客服去处理客户的报销单。如果有了合适的电子化的数据,这部分人工成本将会大大得到压缩。
无论是“开源”,还是“节流”,都是用数据应用对保险的赋能,都可以确定地见到明确的效果。尽管,在今天的数据基础上,可能做出的效果还不尽完美;尽管数据的覆盖度可能还尽如人意,但至少这是个不错的开始。相信随着时间的推移,在正确的方向上不断积累,一定可以实现量变到质变。
4 挑战
大数据的局限
首先有一点需要注意的是,“大数据”的定义在很多场合已经被模糊化。最初的“大数据”仅指来源于互联网业务产生的海量行为数据以及由此而产生的大数据处理技术;但是现在很多场合所讨论的“大数据”已经远远超出了这个范畴,“大数据”已经被泛指所有的数据和与数据相关的技术,包括结构化和非结构化数据。在这里,我想先说一下产生于互联网(包括移动互联网)的大数据(包括技术)本身的局限。
首先,大数据都难以对人的行为做出精确预测,它只能是一种发生某种事件可能的概率。
其次,大数据关注的是相关关系而非因果关系,这就限制了大数据在一些需要确定的、置信度非常高的场景的使用,尤其在信贷风控,保险的理赔等。这也是我一直没有看好所谓的“大数据征信”、“大数据风控”的原因。
由于国内的数据市场还不健全,数据被孤立在一个个巨头处而无法打通。这就势必造成数据来源不均匀和信息不对称。
数据的不均匀,就可能导致分析结果出现偏见或盲区。换句话说,就是我们的采集样本不具有代表性,那么因此最后的结果就会失衡。
虽然每一个数据生产入口都拥有海量的数据,可无论任何一家数据源,都不可能拥有全量的数据,这就造成了客观上的信息不对称,形成一个个的数据寡头。大数据不可能完全消除信息不对称。
上面这四个方面,都是狭义“大数据”的局限性。并不是说因为有这些缺陷而无法应用,只有清楚了它的局限性,在行业应用的时候才能扬长避短,不可片面夸大“大数据”的作用。
当然,在行业的应用中,我更喜欢选择高质量的“外部结构化数据”开道。这些高质量的“外部结构化数据”经过简单加工即可满足保险业务的需要,能取得明显的效果。在行业数据应用的初期,明显的效果和确定性是最为重要的,它是决定能否切入行业,继续走下去的关键。
数据欠成熟
尽管大数据已经经历了五六年的发展,数据无论在维度上还是数量上都已经比几年前有了很大的改变。但是客观上讲,还没有达到质的飞跃。由于相关的法律建设没有完成,数据被滞留在少数流量入口处,形成了一个个数据的孤岛,还没有形成数据的有效打通、流转,更谈不上创造新的价值。
到今天为止,我依然认为数据仅在局部市场,特定的场景已经成熟,可以为客户创造很大的价值。但还没有办法形成规模化市场,这是由于数据发展的成熟度决定的。
数据的缺失,并不能靠高明的算法弥补。这与统计模型,大数据还是人工智能都无关系。只能面对这一现实,去寻找先期成熟的市场,尽可能地立足现在的数据以及算法帮助客户解决他们的实际问题,创造价值,形成商业闭环;同时积极地关注其他市场的成熟。数据应用市场与其他早期市场并没有不同,都是由点及线,最后再到面的。这是个螺旋上升的过程,没有捷径可循。
数据思维尚未建立
与数据的缺失相比,一个更大的挑战在于数据思维的建立。我们正在经历一个从IT到DT的跨越的时代。大数据,机器学习,人工智能,都是这一跨越中的工具。但不幸的是,很多用户还是沉迷于技术本身,没有上升到数据思维。在应用的过程中生搬硬套,导致了数据应用的结果并不理想。
什么是数据思维?所谓数据思维,就是有意识地用数据来发现问题,解决问题;用数据来辅助决策,用数据来指导工作,去提高效率;用数据去规避风险,去重构业务的流程。总之,用数据来说话,数据就是生产力!这就是数据思维的根本。
一般来讲,在行业中是业务驱动技术。但大数据不同于一般的技术,它需要每个部门的参与,并不只是技术部门的事儿。每一个岗位都要学会主动地运用数据,数据时代,没有旁观者。业务部门要有意识地运用数据去发现市场的新的机会,有意识地用数据去量化、指导业务,去优化原有的业务流程;数据部门也应该主动地用数据去帮助业务部门发现问题,并给业务部门合理的建议,与业务部门形成有效的互动。
无论是“开源”的增量市场,还是“节流”的提高效率,降低人工成本,最为核心的只有一点:保险业要回归保险的本质,提高本身的运营水平,跑马圈地的时代一去不复返了。
在对待数据的应用上,要以一种开放的心态,在做好自身数据建设的基础上,有目的有节奏地逐步引入外部数据。在引入外部数据的过程中,最重要的是选择好切入点,要注重融合。外部数据不只是互联网上的行为数据,还有很多高质量的结构化数据。在引入的过程中,要清楚各种数据,各类技术的优缺点,扬长避短,灵活运用,解决实际问题。更要通过引入外部数据和本身数据应用的过程中,逐渐建立自身的“数据思维”,并让“数据思维”渗透到每一个环节,让“数据思维”来指导业务,重构业务,这一点才是至关重要的!
数据服务提供商,在实践数据应用到保险行业的路上,不能一味地夸大“大数据”,“人工智能”等某一项技术的功效,否定传统的结构化数据的应用。而应该将二者都作为行业数据应用的“利器”,结合实际需求,在不同的场合灵活地运用结构化数据和非结构化数据。同时,也需要深入地了解保险行业的背景知识,只有深入地了解了保险行业的需求,将自己变成保险行业的专家,才能更好地帮助行业,做好数据的融合,这才是数据解决方案提供商的成功之道。
保险行业的数据应用才刚刚上路,任重道远。
【 作者简介 】
李晓东,中关村老李,前海航云商大数据业务总裁,目前就职于BBD出任助理总裁。老李既有二十余年ICT的经验,又有十多年开拓新市场新业务的经验,做事沉稳扎实,对新市场和新业务有着敏锐的感知和深入的洞察力。老李于2012年加入百分点,负责移动端个性化推荐业务;2015年加入海航,组建大数据业务部,在很短的时间内就在网约车行业反欺诈、金融科技等领域取得突破;网约车行业反欺诈市场占有率40-50%,实现了业务的几何式增长。
责任编辑:陈近梅