文思海辉符海鹏:大数据时代下的金融数据分析变革(PPT附下载)

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

2016年5月20日周五下午,由上海市大数据联盟牵头,联通小沃科技,华院数据与慧与(中国)共同承办,来自金融服务业、运营商、零售及电商、制造等行业的大数据应用先行者们为各行各业170余位来宾们打开了一扇通向大数据应用落地彼岸的智慧之门。会议由上海大数据联盟副秘书长马慧民与大数据专业媒体—36大数据创始人刘金玲共同主持。上海市科委高新技术处副处长肖菁致欢迎辞。上海市经信委大数据处张敏翀,李强等参加了会议。

36大数据

活动现场,文思海辉副总裁符海鹏做了 《大数据时代下的金融数据分析变革》主题演讲 ,并与大家分享了中国金融服务业所面临的挑战,“利率市场化加剧市场竞争”的内忧;“传统金融业务遭遇互联网金融冲击”的外患;金融大监管的演进;大数据等新技术的出现,支撑金融转型和新业务开创,提升核心竞争力。谈到技术,海鹏说:“Hadoop已经不只是Hadoop”

36大数据

符海鹏从实践中感悟给大家的一些建议:“第一、数据技术在供需两侧同时发挥效力,企业将在此领域产生巨量投入,无论是数据来源和采集,还是数据的分析与应用。第二、IT服务商应该考虑其客户的商业数据流,即与最终客户的数据链接,向一线业务前进。第三、数据人才和从IT技术人员到数据科学家体系的转变仍然是重中之重。”

下面是现场演讲速记和PPT图文直播:

36大数据

36大数据

符海鹏:我们团队其实是非常优秀的一个团队,我个人2001年、2002年做了上海证券交易所的数据仓项目。我们在做交流的时候,其实大部分人还不知道数据分析,或者数据现在做什么。从那之后我们团队逐步发展,包括我们现在的文思海辉。目前我们在数据分析上已经有1500名员工。这1500名员工在为大概60多家金融机构提供服务,且我们其实是覆盖了整个全金融行业,包括:银行业的四大行、股份制、城商行,以及更小的金融机构,再加上另外一个体系——“保险”大体系,其实我们是做到了金融全覆盖。我们的历史也非常悠久,正因为历史比较悠久,所以我们可以看到整个金融行业从最早2001年、2002年开始做数据分析到现在的发展过程。

36大数据

中国金融业务发展面临的挑战。内忧,利率市场化加剧市场竞争。外患,传统金融业务遭遇互联网金融冲击。

前不久蚂蚁金服600亿美金总体估值,相当于交通银行。国内除了四大以外,第二梯队第一位的就是交通银行。所以可以想象到新兴的互联网金融,对于整个银行业或者金融机构的冲击是有多大。第三个层面,我讲是“新技术”。从一个高大上角度讲,我们很自豪,我们在金融圈子里混。因为金融IT圈子里面,一般情况下都是业内最好,他们使用的设备、使用的技术,包括他们所用的相关方法和架构都是整个行业最好。现在,他们突然觉得自己是弱势,特别是在几个新兴的领域里面,比如云计算和大数据。他们突然发现,现在好像大家更多是以“云”的方式去做,而原来银行主要的大客户是对公业务。所以从前金融机构对社交化、移动化的需求并不那么旺盛,而现在这个已经成为标配。

相信通过上面这几个大的背景,大家都能感觉到银行现在对于IT投入是非常巨大的。工行大概有一万多的员工是在从事IT技术服务。苏州银行大概有400多人的IT团队是做信息服务,另外再加上我们这样的公司,大概有1400-1500人在给他们提供IT信息服务。在这样的背景下,作为IT服务人员,我觉得我们的市场未来会变得越来越好。

36大数据

我们看一下具体:监管。中国金融机构最大的领导“一行三会”,大家可以看到在这个领域上有非常大的变化。

(1)从原来简单的数据获取变成了现在需要超量的联系数据。

(2)监管机构会更关注我们在风险领域的诉求。包括:市场风险、操作风险、信用风险等等各方面意识,在整个监管上会加了比较强的诉求。

(3)金融行业间与社会化的影响关联。

08年美国金融风暴产生的时候有一组数据,发生金融危机以后,他们基本上可以在半天的时间内测算出对整个国民经济的影响。中国的监管体系不要说“半天”,我觉得可能半年都比较难出这样一个报告。这也是我们的监管机构想尝试把我们的监管做的更好、做的更完整。

36大数据

银行体系其实发生了比较大的变化是什么?整个服务体系变化。我们原来讲“逆差”,“逆差”我们讲营业点。任何 一个银行在三四年前,主要的盈利范围一定是对公,一定是企业。至少有7-8成左右相关的收入,一定是来自于企业,只有20%-30%才是对私。 由于这样的一些服务变化,会导致银行思维变化。现在很讲 “供应链金融提供整体服务” 。所以我们不是在为单一客户服务,而是 为一个产业从上到下整条线上所有整体提供服务,这样对于整个数据的要求,包 括:数据关联性的要求会差别非常大。同时站在银行这个体系里,由于这样一些市场总体用户群体的变化,会导致他的产品创新。原来我们可能推出的所谓产品创新,更多来自于对公客户,可能给客户提供更好的微贷服务或者怎么样。但是现在可能 更关注中小企业的实体,包括:个人实体,这两块都是要更加的关注 。同时任何渠道方,比如:原来我们可能更多是柜台排队,现在走进银行已经到这么发达的程度了。再到下一个阶段就是无柜台、无柜面,什么都没有,就是虚拟银行。现在互联网基因银行,基本上做的就是这种模式。针对于这样的一些情况,我们其实有一个所谓的专业服务平台要搭建了。无论是数据类的给大家提供支撑的,还是在银行或者在金融机构做的前端的平台,都需要做相关的改造。

最后要说一点,所有的这些都是要融合在一起。要放在一起,就是要靠数据把它们融合在一起。

36大数据

我01年刚入行的时候做的是证券。我们现在从证券来看,证券跟银行不太一样。证券是有三大属性的机构:证监会下面会有各大交易中心,再往下才是券商。而对于三个层面来讲,其实我们做的是不一样的事情。对于我们交易所的角度来讲,交易所更多的是要扩大规模,把我们的服务做好,包括:整个关联性做好。举个例子,证监会的层面上,更关注是沪市跟深市等等数据融合问题。而证交所更关注的是黑户是哪些,做仓的股东是哪些,有些什么样的问题等等。而我们券商领域,会更为关注整个市场的营销,怎么去获取更多的客户,为更多的客户提供服务。每个点关注都是不一样的。

我给大家看一下自己本身公司做的图。

36大数据

36大数据

其实这些都是我们的客户。可以看到,我们整个在会属机构,延展到交易所再延展到券商。大家也看到,有很大的变化。从最早期做数据平台类的项目,到现在逐步做统一的监测系统,统一的分拣系统。最近我们也做了一些单子,是跟深交所、上交所做合作。类似于这样的一条线路去发展。

36大数据

36大数据

数据生态圈。 其实我现在到银行里跟他们谈数据仓库、数据挖掘,不太愿意听了。他们最愿意听的是: “你们在外面跟哪些公司在合作?”为什么?可能自己的数据不够,还要尝试拿外面的数据 。因为银行不知道外面的市场什么样子,我们也在积极跟这样三类公司合作:1.三大运营商。2.BAT。3.在每个细分领域自己独特特色的。比如:九次方、Takingdaata(音)等。

基于这个生态圈,我们可以看到目前金融机构要获取数据如果从几个维度来看。内部结构化、内部非结构化、外部结构化、外部非结构化。目前为止所有的银行除了内部做的可能还相对不错,把自己的数据仓库等做好以外,也不停的往外延展,延展在这个圈子里面的内容。从再具像来看,我们看银行业务上,重点在哪几个领域有变化?银行其实是有百年历史,可能跟通信行业、互联网完全不一样。我不想说我们创造了多少应用,因为光是把国外的一些经验,包括:国内发展的业务学习完,我觉得就已经不容易了。但是,我认为还是要定位成两个方面。

36大数据

一个方面,把自己的数据用好。另一方面,结合大数据时代背景,下我们相关的信息补充进去做整体融合。希望在金融机构里面大家是齐头并进的,而不只是把大数据作为唯一要发展的目标。

原有业务或新的创新在银行的几个方面:

36大数据

36大数据

1.综合营销服务体系的变化。

在综合营销体系里面: (1)构建用户画像。在银行或者金融机构里面,它所有的基础信息是非常广的。从基本信息、财务数据、关联信息、违约信息、评分记录等等,会形成用户画像视图。(2)基于这些客户基本信息,打上新标签。

36大数据 36大数据 36大数据

这个领域银行已经做了很多年了,比如:你们在每个银行可能都有标签,你们是VIP用户。现在社会会发生很大的变化,由于社交变化,现在打标签在银行变了,他是一个飞行达人,他是一个旅游达人,他是一个购物狂等各种属性。现在我们要把标签打的更加符合这个人的本性,而这在未来营销、风险把控,包括:征信等各个领域上,会影响到最终对每个客户的决策。除此之外,还有实时性。以前讲过一个经典的案例,当你在ATM取一笔钱的时候,我就能判断你下个月可能要向我借款,我就马上能推送“信贷服务”。

36大数据

36大数据

现在这种东西越来越流行,而且要在这方面做更多的努力。同时,渠道端要做更大的变化。我们要通过无论是手机、终端这种虚拟设备,VR技术,我们要通过各种手段实现在整个全渠道。

36大数据 36大数据

2.全方位的风险管理与征信体系。

大家可以看到,很多银行在降息。在上海应该是,我们原来有个说法叫:“北民生,南浦发。”什么意思呢?北边的民生工资待遇最好,南边的浦发最好的是浦发。节流对于银行来讲,最好做的是风险把控,这是它最优势。

36大数据 36大数据

3.数据服务体系的全面建设。

以前我们讲,去银行很简单。给我们做三千张报表、两千张报表,我的项目就结束了。下面我提一个案例,民生银行ALD系统,这个系统设计的不是光应用,设计的是在整个数据层面上的数据分析。是有一个规章制度,同时从需求端管控。除此之外是另外一个领域,就是数据挖掘在银行真正应该。过去数据挖掘在银行可能更多是噱头,这两年我团队里面,大概1500人里面,大概有200人是做数据挖掘相关服务的。这两年,他们完全做不到停在一个地方停一会儿的情况。为什么?因为大数据时代,业务部门对于数据的要求越来越高。业务更多的是希望除了我们讲的业务做好以外,我们还要知道这个产品未来会不会赚钱,我这个客户群体未来会不会消失。

36大数据 36大数据

4.数据管控在金融业的全面重视。

如果按照现在这种技术发展的趋势,在大数据趋势下,我可以一个条件下找出所有的交易,是有可能的。但是我说另外一个,无论你是否有没有这种模型,你得有标准。无论你说在底层存储角度有没有模型,但是在另外一个角度要有一个标准,你必须要在上面做数据质量监控,要了解数据真实情况怎么样。否则你收集了再多数据,内部加工再多的数据,只是一堆垃圾,并没有把这些东西作为价值。所以在这个领域我强调,特别是在金融领域,要求99.99%的可靠性。我认为还是要非常严谨的看待这个事情,至少要把我们的数据管理好。

36大数据

5.传统应用新特征,基于集团一体化混业经营机制和协同效应探索。

不管是我们讲的大的银行,还是中型的或者讲集团,类似于安邦、华润这样的。我如果把保险的客户推荐给我的证券,我的证券客户如果把所有的存款放到银行,这就涉及针对于数据联通跟打通的问题。我相信这个会成为未来一两年之内,是市场上非常热点的。

下面,我稍微讲一下应对。

1.整合。如何把数据有效的整合在一起。

2.如何做分析。

3.如何管理好。

其实就是这三件,最后一个最大的就是“人才”,人才的支撑。至少我在金融领域还是有一定的品牌影响力和优势的。

36大数据

支柱一:大数据整合平台,混合式大数据平台。

也许我们的底层是一个基于Hadoop的大数据平台,但是在更上一层希望大家用一体机架构,或者是哪怕用一些开放式的数据库也OK,但是我们希望是混搭的模式,在应用上更保证我的可靠性。

36大数据

在Hadoop领域上,技术延展性太强大了。我们认为在这个领域上,Hadoop日新月异。我再稍微讲一个小的故事,大概在四五月前,我问我的一个项目技术员工。我说:我们要做一个数据挖掘项目。原来它的版本只可以跑在单机上。为什么不可以把这个东西放在分布式,像小马拉大车一样跑呢?他们说:“现在做不到,还不提供这种技术。”三个月我再问他,他说:“已经OK了。”所以在这个领域的技术变革是非常快的,我给大家的建议是“多学习”、“多跟踪”。这个领域可能是日新月异,今天觉得足够OK,明天可能就会落伍。

36大数据 36大数据

支柱二:数据分析应用。

这个领域上,可能每个行业会有它的不同。我们已经是在银行把“分析应用”这一块,用到相对极致的程度,特别是在数据层面了。

这里特别提两点:1.人才。我觉得这一点,我还是比较自豪的。自豪在哪里?我们本身有1500人在金融行业。文思海辉已经跟一些学校合作,我们自己也有大数据人才学院。在北京是跟中科院,在上海是跟同济。甚至我们已经在贵阳,跟贵州大学也是跟贵阳大学,包括:省政府合作尝试去做“大数据人才学院”。我们大概应该有培养了三四百个实习生,大概有三四百在我们体系内。而且基本上是除了我们以外,在外面在流动。

文思海辉是一个比较大体量的公司,目前为止我们其实是想通过我们在金融行业的一些做法,在数据的一些方法论,包括我们对行业的理解,想把我们延展。目前已经延展到两个大的行业:1.企业。2.政府。在企业里面,我们延展的第一大块是航空。目前深航、厦航、东航已经是我们的客户,制造业已经有海尔这样的集团。政府领域上,我们跟贵阳市政府也签了合资公司。我们也想在这个领域上,通过人才培养,做到把金融的一些本领带给别的一些地方。

36大数据

最后我想讲几句话:

1.数据技术供需两侧同时发挥效力,企业将在此领域产生巨量投入数据来源和采集,数据的分析与应用。

2.IT服务商应该考虑其客户的商业数据流,即与最终客户的数据链接需要向一线的业务前进。

3.数据人才和从IT技术人员到数据科学家体系的转变仍然是重中之重数据人员。

数据科学家同时要懂业务和相关技术,通过业务理解,用自己的相关技术把这些应用加工成更多的产出,这才是正确的产出。

我今天的演讲就分享到这儿,谢谢大家!

下载完整版演讲课件Pdf: 大数据时代下的金融数据分析变革.pdf

End.

随意打赏

文思海辉
提交建议
微信扫一扫,分享给好友吧。