电信大数据在信用风险管理中的应用
摘要: 电信大数据是非常好的可替代数据源,用于消费者的信用评估。同时信用风险管理也是电信运营商日常的一个重要工作。介绍了消费者信用评分在电信信用风险管理中的应用,对电信大数据作为重要的替代数据在金融授信中的应用进行了案例分析,对国内电信大数据如何在信用风险管理中发挥作用,提出了专业的建议和展望。
关键词: 电信大数据 ; 信用风险管理 ; 信用评分 ; 可替代数据 ; 数据共享
中图分类号: F832 文献标识码:A
doi: 10.11959/j.issn.2096-0271.2017033
Application of telecommunication big data in credit risk management
LIU Xinhai1, HAN Han2, DING Wei3, WANG Ti3
1. Credit Reference Center,People’s Bank of China,Beijing 100031,China
2. Chinese Academy of Information and Communication Technology,Beijing 100191,China
3. Network Technology Research Institute,China United Netork Communications Co.,Ltd.,Beijing 100048,China
Abstract: Telecommunication big data is good alternative data source for credit evaluation of consumers.Meanwhile,credit risk management is a crucial task for telecommunication operators.In this work,the application of telecommunication big data in credit risk management was introduced.The application example of telecommunication big data in financial credit scenario was analyzed.Some suggestions were given about how to employ telecommunication big data to credit risk management in China.
Key Words: telecommunication big data, credit risk management, credit scoring, alternative data, data sharing
论文引用格式: 刘新海, 韩涵, 丁伟, 等. 电信大数据在信用风险管理中的应用[J]. 大数据, 2017, 3(3): 94-102.
LIU X H, HAN H, DING W, et al. Application of telecommunication big data in credit risk management[J]. Big Data Research, 2017, 3(3): 94-102.
1 引言
征信体系是市场经济的国家级金融基础设施,对降低交易成本、管理信用风险、促进信贷市场的健康发展起到了不可替代的作用。自2015年中国人民银行(以下简称央行)通知8家民营征信机构准备个人征信业务以来,资本市场、互联网大数据公司、金融机构纷纷尝试个人征信业务。国内的征信业刚刚起步,现有征信系统虽然已经有基本的架构,但是覆盖人群和服务有限,需要多层次的征信体系才能够满足飞速发展的市场经济下消费金融的需要。从国外征信业的实践来看,电信数据由于具有“先用后买”的授信特性,而且在覆盖度和鲜活性方面都有优势,成为除传统信贷数据之外进行信用评估的重要替代数据。因此,电信大数据也成为国内征信业发展中的关注热点。
目前,除了民营征信机构积极尝试电信大数据的应用之外,我国的三大主要电信服务商均已在征信领域有所行动:2016年1月中国移动集团公司(以下简称“中国移动”)和招商局集团合作,在深圳市前海深港现代服务业合作区成立了试金石信用服务有限公司;中国电信集团公司(以下简称“中国电信”)的天翼征信有限公司成立于2014年12月,2015年5月获得企业征信牌照,2015年3月推出个人信用评分,拥有中国电信和翼支付积累的丰富大数据;中国联合网络通信集团有限公司(以下简称中国联通)也在积极筹备征信相关的一些基础工作。3家电信运营商筹备征信业务,看重的是征信市场这块大蛋糕,背后仰赖的是其独有的天然优势——数据资源!现在手机已经实行实名制,电信运营商掌握着用户详实的背景资料、行为数据,还可以掌握用户的位置信息、通话通信记录、交费消费记录,这些数据也早已经纳入国家征信系统。而之前被央行批准开展个人征信业务的8家机构也掌握着不同类型、各具特色的个人信息数据。
根据《征信业管理条例》,电信公司在业务经营过程中收集企业或个人的信用信息(如欠费信息),仅在内部使用时,不视为征信业务。一旦电信公司将信用信息提供给征信机构或者从征信机构查询信息主体的信用信息,电信公司就成为了信息提供者,此处的“信息使用者”范畴应遵守《征信业管理条例》中关于信息提供者、信息使用者的规定。
国内电信运营商纷纷在征信市场布局,但电信大数据和征信的关系、电信数据是否对(金融)征信有用、电信运营商是否可以成立征信机构等问题还存在争议。2015年10月26—27日,在陕西西安举办的“亚太征信暨个人数据保护国际研讨会”上,世界银行集团全球金融基础设施建设技术援助负责人托尼·里斯革表示:“手机运营商和电信商开展征信,违反独立第三方的基本原则。如果人人都想成立自己旗下的征信机构,就会造成一个个的信息孤岛,没人愿意分享信息。信息不能流通就没有价值,电信运营商的信用报告或信用评分必然是不全面的、分散的,这对中国金融业的可持续发展不是一件好事”。
本文将结合国外的实际案例,讨论和分析电信大数据在征信领域的应用。首先,介绍如何解决电信运营过程中存在的信用风险管理问题(或称为征信问题);其次,对征信机构利用电信数据的情况(利用电信还款和信贷还款的相关性)进行风险分析;最后,结合中国国情,提出如何将电信大数据和征信业务结合,为建设市场化的征信机构提出建议。因为消费者征信业务和电信运营商联系更密切,所以本文主要讨论的是消费者征信业务。电信运营商与企业/商业征信也存在联系,将在后续研究中讨论。
2 电信运营业务中的征信问题
电信运营商自身的业务也存在和银行信贷类似的信用风险管理问题,如手机或电话话费的预售类(后付费)信贷业务、通信话费的催收、电信服务申请中的防欺诈等。
相比银行信贷的征信问题,电信运营商的征信业务涉及的金额较小,客户多而且更加分散。在欧美发达国家,电信运营商一直就是传统征信机构的服务对象,例如全球第二大征信机构艾克飞(Equifax)在2014年的征信业务收入中,有6%来源于电信运营商。
国外的电信运营商解决消费者征信问题主要通过3个途径:利用电信运营商内部的行业协会建立自己的消费者征信数据库,提供相关的征信服务,通过各个分散的运营商之间完善的信息共享机制降低成本;根据信用的相关性,借用传统征信机构的信贷征信信息进行风险管理服务,由于金融信贷的信用更重要、最可靠,因此可以自然延伸到电信领域的信用;与数据服务商合作,根据电信数据开发消费者信用风险评估模型。
2.1 电信行业内的信用风险管理
2.1.1 基本概况
在美国,电信运营商每年的坏账损失(拖欠通信花费)达到10亿美元。为了减少这种消费者信用风险,在多年前,具有商业远见的多家电信公司高层们联合组建了全国电信和公共事业消费者信息交换中心(NCTUE)。全国消费者电信数据交换中心(NCTDE)建立之初只包括电信行业企业,后来付费电视和公共事业服务公司也陆续加入,使其发展成为会员制的公司。会员之间共享消费者的数据,识别高风险消费者。
2.1.2 NCTUE的发展历程
20世纪80年代后期,长途电话的商业信用风险经理和西南信用风险管理委员会联合成立了全国电信信用组织,想共同建立一个全国性的数据库。经过多年的努力,一个非盈利机构——全国电信数据交换中心(NTDE)于1993年诞生了。1994年,艾克飞成为NTDE的数据技术厂商,1995年数据库可以使用。1997年,经美国司法部批准,NCTDE成立,选择数据处理和服务经验丰富的艾克飞作为承建商。2002年NCTDE和艾克飞正式签订合同管理数据库,同年美国司法部批准电信数据和公共事业数据合并为一个数据交换中心——NCTUE,随后37家公司加入了NCTUE,包括2003年付费电视的加入。2009年,艾克飞和NCTUE建立了新的NCTUE plus数据库,将成员机构提供的交易级别账户信息添加其中,对已有的仅存储负面信息的数据库进行编程改造,成为存储包括征信信息在内的综合信息的工具,可以满足更好的决策需求。NCTUE plus数据库整合了成员机构的所有账户数据,可以和传统的征信文件一起应用,这个工具可以给成员提供360°的消费者视图,在客户的生命周期过程中做出可盈利的风险决策。目前,NCTUE的成员机构包括全国性的、区域的和当地的公司,覆盖了有线电视、电力、煤气、互联网、市话、长途电话、卫星电视、水等行业。NCTUE有3.42亿条消费者记录(其中的2 500万消费者没有信用记录),包括电信、水、电、煤气等新申请、账户历史、偿还历史、违约和欺诈等60多种数据。NCTUE逐渐发展成为美国的一个提供运营商数据和公共数据的特殊征信机构(special credit reporting agency,SCRA),受美国联邦消费者金融保护局(Consumer Financial Protection Bureau,CFPB)监管。
2.1.3 NCTUE的征信服务
NCTUE作为一个特殊的征信机构,能够在客户服务申请中帮助电信运营商审查新的消费者,检查其是否存在通过未付款账户来减少损失、增加盈利的情况,目前主要提供信用报告,尚未提供基于信用报告的信用评分。
通过加入NCTUE,成员可以在减少风险方面获得25%的提升,成员可以享受以下服务:
● 确认一个新的申请者在其他成员公司是否有明显的未付余额(unpaid balance)和由于未付款而关闭的账户(unpaid closed account);
● 确定包含复制和无效的社会保障号的欺诈申请;
● 通过数据分析确定准确的账户押金,根据消费者的电信征信报告,做出是否需要消费者缴纳服务保证金的决策;
● 从其他成员那里获取更新的地址信息,加强跟踪客户和收债的效果,可以使用艾克飞的信息交换搜索(Equifax exchange search)服务的客户追踪解决方案;
● 收到管理报告,观测未付款账户的变化,分析偿还特征,进行账户审查、活动分析等;
● 当数据库中因未还款而关闭的账户信息和新的客户服务申请信息匹配时,自动给会员机构提示;
● 数据交换可以通过在线和批处理的方式进行。
上述服务都是基于消费者的信用报告,这些成员的权限不同,分为成员(member)、附属成员(affiliate member)和助理成员(associate member)3类,根据级别的不同享受到的服务也不同。
2.1.4 为个人消费者提供的服务
由于受到美国联邦消费者金融保护局的监管,NCTUE也比较注重维护消费者权益,满足合规性要求。NCTUE的电信信用报告分为两种:一种是供成员机构使用的,相当于央行征信系统的机构版;一种是为消费者提供服务的,相当于央行征信系统的个人版。NCTUE每年免费向消费者提供一次信用报告。在12个月之内出现负面信息,或是被查询超过8次的账户,也可以获得免费的信用报告,额外查询的费用为每份8美元。当消费者反映报告信息存在问题时,NCTUE会和数据源一起调查数据问题。
2.1.5 信息共享机制的形成
NCTUE规定:如果会员机构需要从NCTUE获得数据,就必须贡献出该机构的数据。对于一些成员机构来说,在提交数据时存在泄露自己客户信息的顾虑。但是如果没有共享客户信息,造成的损失往往是共享信息的8倍之多,最后博弈的结果通常是,会员机构清楚地认识到NCTUE的价值,形成了信息共享的机制。对某个会员公司10年来的信用风险损失进行分析,可以发现53%都是由于消费者中断了服务,这其中的大部分消费者没有押金来偿还账单,同时,70 %的损失没有进入催收环节。这项研究证明了NCTUE的消费者信息共享模式可以有效地对电信运营商的信用风险进行管理。
2.2 风险决策
对于电信运营商来说,电信服务的消费者分散而且数量众多,涉及的服务金额比较少,所以需要进行自动化、批量化的自动风险决策。和需要人工审阅的信用报告相比,信用评分是电信运营商进行风险管理的不错选择。由于消费者信贷信用评估和电信服务的信用评估具有高度的相关性,许多电信运营商直接利用传统征信机构提供的FICO信用评分(FICO信用评分是由美国个人消费信用评估公司开发出的一种个人信用评级法)(基于银行信贷)进行决策,例如如果消费者的FICO评分超过了620分,则可以获得手机话费授信服务,即免押金;而低于620分的消费者就需要交押金获得服务;低于550分的消费者无法获得服务。征信服务只是信用风险管理的重要环节,每个电信运营商可以根据FICO信用评分自己制定风险决策规则。
另外,三大征信机构根据电信运营商的征信需求,纷纷开发了服务于电信运营商的消费者信用评分,这种信用评分的数据不是基于银行信贷,而是基于NCTUE的信用报告和电信运营商本地的数据。艾克飞的早期违约评分特别为电信行业设计,利用了多源模型,合并了电信运营商的业务信息、负面公共记录信息和交易数据,能够对电信行业的偿还和违约行为进行预测,特别是预测最初4个月消费者不付款的可能性,筛选出不愿意付款的消费者。类似地,环联(TransUnion)公司开发出了TransUnion通信模型,益博睿(Experian)公司也开发出了TEC信用评级模型,利用征信数据评估客户。
2.3 信用风险评估模型
除了直接利用从传统征信机构获得的基于银行信贷数据的FICO信用评分和三大征信机构为电信运营商量身定制的电信信用评分之外,电信运营商还使用一些数据服务商提供的消费者信用评估。美国的电信数据公司Tiaxa提供的信用快充服务就非常具有代表性。
Tiaxa是一家高科技公司,为移动通信市场提供基础设施、清算中心和增收服务,提高预付费用户群的管理效率,并为世界各地的主要运营商增加收入。Taxia的在线信用快充服务是专门为预付费用户设计的,功能是当其可用余额不足时,提供信用金额充值服务。根据用户的行为数据,Tiaxa采用专有的评分方法与运算规则(该评分技术申请了专利),对用户的行为进行分析、分类和评分,确定每位用户的合理信用额度。用户使用该服务之后,可利用Tiaxa提供的额外信用金额防止通话或数据会话中断。当用户充值时,其已使用的信用金额将得到补偿。目前Taxia还没有和金融机构直接合作,仅和运营商合作,提供预授信(如Nanocredit、微贷服务)决策分析服务。Tiaxa的信用快充服务平台已经在拉丁美洲的8个运营商实施并运营,包括哥伦比亚、秘鲁、墨西哥和阿根廷的Movistar以及Vivo,活跃用户超过400万户,每天处理着数量巨大的交易数据。
3 电信大数据在金融征信中的应用
由于缺少传统银行信贷记录,全球有25亿人无法享受金融服务,但是这些人中有16亿人拥有手机,很多都是后付费用户。由于电信付费数据是和金融征信强相关的数据源,传统的征信机构也开始设计将电信大数据应用到征信业务的产品,主要围绕通信话费缴纳,为金融机构提供替代信用风险分析方案。新兴的大数据公司比较激进,整合消费者除话费缴纳之外更多的电信大数据(包括通话行为),主要在新兴市场国家为普惠金融机构提供风险分析服务。
3.1 传统征信机构的可替代信用评分
起初,国外的征信机构没有把电信数据纳入征信报告。2015年,FICO和Equifax、LexisNexis 3家公司合作启动可替代评分项目,在12家大的信用卡公司使用,对不能获得传统信贷服务的消费者进行信用评估。Equifax提供NCTUE的电信数据,该评分模型称为FICO XD。相关研究结果表明电信数据具有相对较好的效果,利用替代数据,可以为大约50%不能进行传统信用评估的用户正确评分。上百万的消费者可以拥有比较高的信用评分,享受正常的金融服务,并且很多拥有新评分的消费者很快成为了金融服务的主流人群。上述机构在利用电信数据进行信用评分的同时,将电信数据也纳入信用报告,提供给金融机构或消费者。国外征信机构将电信信息用于银行信贷风险评估的大数据模式目前还在尝试阶段,还称不上成熟。
国内央行征信系统很早就开始采集相关的电信信息,并将其纳入企业和个人征信报告,这项信息包括电信欠费、时间和金额、业务类型、记账年月、业务开通时间和欠费金额等。截至2014年底,个人征信系统中的电信数据在非银行数据中的占比为4.15%,约有1 047.85万笔记录。企业征信系统中的电信数据在非银行数据中的占比为10.19 %,约有338.33万笔记录。
3.2 面向普惠金融的创新尝试
过去10年中,移动终端发展到无处不在。超过90%的人有移动电话,在发展中国家,蜂窝电话数据使用者多于发达国家。随着移动电话成为新兴市场中必要的交流模式,可收集和分析的数据变得越来越丰富和可描述。通话信息记录数据库提供了一系列包括通话对象、频度时长和支付信息等特征内容的详细信息。研究发现,通过简单的特征(如通话的间隔时间、账户服务的持续性、余额询问频率和通话时长等)可以构建相对有预测能力的模型。一些风险管控服务提供商(如Cignifi、First Access、MasterCard Advisors等)已经开发了针对缺失传统征信记录的消费者的风险控制模型,根据这些模型显示预付费用户的付费情况,通话、上网行为等信息能够在一定程度上预测贷款人的还款意愿及还款能力。针对消费者几个月的手机数据便能提供足够的样本量进行风险建模。例如统计显示,发起呼叫的数量(不是接收呼叫的数量)较多以及通话时长较长这两个维度与信用度是正相关的;相反,在一些模型中,如果工作时段接听较多的电话或者通话的朋友圈相对较小,则可能是低信用客户。因此,基于预付费手机相关数据的风险控制建模,可以极大地帮助一些缺乏征信数据的发展中国家的市场实现普惠金融的健康成长。大数据公司Cignifi和First Access是进行这种尝试的典型代表。
Cignifi是一家基于电信数据的风险和信息分析公司,大概成立于2011年,在巴西进行测试,总部在美国马萨诸塞州的剑桥,很多商业创意产生于英国的牛津大学。基本业务市场营销和风险评估分别对应两种产品,即市场营销倾向性评分和风险评分。Cignifi的信用评分是为金融机构、零售商和保险商开发的,可以为没有传统信用评分历史的顾客服务,效果很好,涵盖信用卡、循环信用卡和短期的消费者贷款,在不增加风险的前提下使消费者贷款的批准率达到了25%。
Cignifi用到的电信大数据不仅仅限于话费缴费信息,其主要的一些数据指标包括:通话时长、每天用电话的时间、通话的频率、谁先打的电话、电话的位置信息、短信(SMS)和数据的活跃度、定时和充值金额。所在的市场包括墨西哥、加纳、智利、巴西、乌干达、菲律宾、尼加拉瓜,都是新兴市场的一些业务。Cignifi注重与电信运营商和传统的征信机构合作,目前的合作伙伴包括:Equifax、Telefonica、Globe和Airtel。
First Access是一家面向微金融服务的信息服务商。首先在坦桑尼亚开始了相关的工作,涉及的产品有:微贷、分期贷款、短期贷款、农业贷款、小微企业贷款、太阳能灯贷款和房屋装修贷款等。其主要的服务对象是:商业银行、微金融机构、盈利或者非盈利金融机构。在进行信用评估时,该公司考虑的因素是:移动电话、水、公共设施、被申请者启动的电话次数、所在电话网络的大小和充值的频率等[1]。First Access通过查看客户的手机通话记录与短信记录,对客户的信用状况进行评判。First Access监控的并不是通话与短信的内容,而是通话的时间、时点、地理位置、频率、通话费用等数据,从而通过分析这些数据形成对客户的行为特征判定。在特定客户的行为特征模型形成之后,相互的通话也将成为其他客户行为特征的判定因素之一。最终,First Access通过内部算法得出相应的信用额度。整个过程通过自动化算法分析完成,因此从客户同意提供数据到信用额度的公布仅需要几分钟的时间。
First Accesss在应用中也取得了一定的效果,相比传统的风险分析方法,每一个借贷者都节省了将近12美元的花销,在最初的18个月内就有超过75 000个借贷推荐。
4 国内情况分析和政策建议
电信大数据是与消费者信用强相关的征信数据,仅次于银行信贷数据。根据世界银行2014年发布的报告可知:全世界人口中有近1/3的人没有银行账户,因此对这些人来说不仅银行征信资料是缺失的,甚至任何资金的记录都是空白的。相比而言,拥有手机的人口则占全世界人口的3/4,即拥有手机的人比拥有银行账户的人多。目前国内征信市场的状况是:10亿人无传统信贷信用记录;1亿人没有足够的信贷信用记录进行评分;央行征信系统主要服务于银行信贷机构。但是,国内手机用户已经超过13亿户,互联网的网民规模已经达到了6.5亿户,普及率达到47.8%,加强电信大数据的应用和研发对于发展普惠金融意义重大。在个人数据保护方面,目前的监管现状为利用电信大数据进行征信业务创新拥有足够的发展空间。电信数据对于民营征信机构来说是非常重要的征信数据,其可靠、及时、银行信贷的相关性等特征可以用来解决中国的征信难题,帮助更多消费者享受普惠金融的服务。
电信运营商在尝试征信服务的过程中,要注意国内电信行业的数据整合,征信的本质是整合碎片化的局部信息,得到更完整的信用主体的视图,才能有效地减少信息不对称的问题。一个更加完整的电信大数据库是很有价值的。图1列出一个电信大数据的顶层设计构想,基本的思想是基于现有传统征信机构的商业模式(如信息共享、信息整合、第三方机构运营等),由几大运营商联合或由独立第三方来完成电信信用基础数据库的运营和构建,一方面服务于运营商内部,另一方面和传统征信机构进行信息共享。如果没有一个完整、统一的电信大数据库,碎片化的电信大数据对于征信的价值将大打折扣。但是笔者在与工业和信息化部的相关研究人员沟通过程中了解到,整合3家国内大的电信运营商的数据阻力重重,很难实现。不过,近期也出现了松动的情况,2016年1月13日,中国电信、中国联通在京签约,开放共享包括网络、业务和服务在内的各类资源,并探索业务、资本各层面的合作,推进网络、终端等供给侧结构性改革[2]。希望将中国电信和中国联通的业务和数据整合成一个类似于NTCUE的电信大数据库,既能方便解决电信行业的信用风险,又能给普惠金融提供支撑。
图1 电信征信系统顶层设计
电信运营商在尝试将电信大数据用于金融征信的同时,不要忽略电信行业本身存在的信用风险管理问题,如果对电信数据的利用不能解决电信运营商自身的征信问题,就无法让金融机构相信电信大数据在征信中的价值。
随着征信系统的建设,电信运营商要进一步扩大后付费的用户服务。欧美发达国家基本上采用的是后付费服务,相比于预付费方式,可以让消费者更方便地采用“先用后买”的方式享受电信服务。而国内的大部分电信服务目前还是预付费模式,未来在4G时代会有更多的后付费服务出现。征信系统需要不断完善,电信运营商可以不断提高服务水平,提供更多的后付费服务。对于电信大数据来说,无论是用于电信运营商内部授信的风险管理,还是作为金融机构的替代数据进行风险管理,最有价值和符合合规性的数据就是电信服务后付费用户的数据。所以电信运营商未来在扩大后付费用户服务的同时,也间接地促进了电信大数据在征信系统中的应用。
参考文献:
[1] 刘新海 . 征信与大数据[M]. 北京: 中信出版社, 2016.
LIU X H. Credit information service and big data[M]. Beijing: Citic Press, 2016.
[2]安建, 刘士余, 潘功胜 . 征信业管理条例释义[M]. 北京: 中国民主法制出版社, 2013.
AN J, LIU S Y, PAN G S. Interpretation of credit investigation control regulations[M]. Beijing: China Democratic Legal Institutions PressPress, 2013.
刘新海 (1976-),男,博士,中国人民银行征信中心副研究员,主要研究方向为信用风险管理、大数据和金融风险分析。
韩涵 (1985-),女,博士,中国信息通信研究院高级工程师,主要研究方向为智慧城市、应急通信和大数据分析。
丁伟 (1972-),男,博士,中国联合网络通信有限公司网络技术研究院高级工程师,主要研究方向为投资规划和大数据分析。
王题 (1976-),男,中国联合网络通信有限公司网络技术研究院高级工程师,主要研究方向为通信网咨询规划设计。
责任编辑:陈近梅