蚂蚁金服推出“淘金100”:大数据选股渐成风潮
沪深300指数、中证100指数,这些传统的基准指数对于投资者来说耳熟能详,但在互联网金融爆发的态势下,阿里巴巴、百度等互联网巨头正在以更凶猛的势头抢滩指数市场。与传统指数根据股票市值统计不同,他们手中握有的最大优势是大数据。
4月9日,蚂蚁金服联合博时基金等机构发布了全球首个电商大数据指数“淘金100”(中证淘金大数据100指数),以电商数据为基础构建行业景气指数,为投资者选股给出分析,并将在4月中下旬发布基于淘金100指数的两支公募基金,即招财1号保本基金和淘金100指数基金。而在此前,百度和新浪也曾基于搜索和新闻热度大数据发布相应的指数基金。
记者采访数位互联网金融业内人士了解到,在由渠道、技术、数据组成的互联网金融底层架构中,互联网公司与传统金融机构的合作正在从渠道销售、技术保障的层面向更深层次的数据挖掘和利用方面拓展,将在未来展现出一副数据经济图景。
对电商交易的大数据加工分析后,来预判某个行业的繁荣程度和景气走势,为选股投资提供依据,这是包括淘金100在内的大数据指数正在做的事。那么,大数据选股靠谱吗?
与传统股票指数一样,淘金100也是一个股票指数,是基于海量的电商交易数据得出,反映一揽子股票价格变动趋势。在蚂蚁金服内部有一个被称为“维他命”的金融信息服务平台,上面汇集了线上线下海量交易数据,对这些数据进行脱敏、加工,再结合行业业绩和财务表现,从35个行业共1740个相关股票样本(覆盖70%的上市公司)中选取最好的100支作为指数成分股,以此反映行业景气度。
对于淘金100指数的产生,主要依靠蚂蚁金服的行业景气指数、博时基金的综合财务因子(比如市盈率、净利润增长率)和市场驱动因子(比如短期收益率、交易量变化),就像3只漏斗一样,将1740支股票注入其中,筛选出最符合条件的前100名。
如果把行业景气指数比喻成一个可以反映行业走势晴雨状况的气象站,那么在建站过程中就需要有卫星监测范围(相当于中证提供的与电商类目相关的三级行业列表),测算水文、海拔、气温等信息(相当于电商大数据),还要有气象师(相当于基金公司),最终给出天气预报(相当于指数基金产品)。
博时基金副总裁王德英对记者说,指数模型是动态的,除了不断优化电商大数据,增加行业数据源之外,还会回溯大数据与资本市场的关系情况,把握其中的规律变化,而综合财务因子和市场驱动因子两大类中的数十个细分维度也是变化的,且与每隔半年调整一次指数成分股的沪深300指数相比,淘金100将其缩短为一个月,这些都是为了追求时效性。
王德英说,行业景气指数在三个因子中的占比约为30%,以线上的电商大数据为主,未来会不断拓展各种数据源,让指数所反映的市场行情更精准。
对于蚂蚁金服、博时基金、恒生聚源和中证指数这四方所扮演的角色,蚂蚁金服金融事业部总经理袁雷鸣做了一个很形象的比喻,蚂蚁金服好比一个金融大厨房,里边有各种厨具(比如云计算平台)和食材(比如大数据),也有餐馆(比如招财宝等面向用户的金融产品),但缺少有经验的大厨,之前引入天弘基金做出余额宝(货币基金)这道菜,相当于基金行业中的“白米饭”,但食客不能满足于只吃主食,因此还要邀请博时基金等大厨在蚂蚁金服的厨房里做出更多菜肴。
更准确地解释,对于淘金100指数的出炉,中证方面是指导者的角色,提供对所检测行业的列表,蚂蚁金服和恒生聚源对阿里的电商大数据和外部数据进行分析加工后,由中证指数编制出淘金100指数,而博时基金提供的是对原始数据的加工能力,并根据该指数发布最终面向用户的基金产品。
去年11月,恒生电子联手蚂蚁金服、第一财经、云汉投资斥资3.9亿元入股恒生聚源,后者的业务是向金融机构和投资者提供投资终端和数据库等产品。9日,恒生电子高级副总裁方汉林对《第一财经日报》记者说,在淘金100指数的产生中,恒生聚源除了提供食材的补充外(恒生聚源拥有更多的电商外部数据源),还扮演着大厨帮手的角色,发现并生成指数因子,而在私募中,甚至可以直接充当大厨。
这次为选中了博时基金,其他基金是否有机会,而阿里系的天弘基金和德邦基金是否也会发布类似的指数基金?对此,袁雷鸣对记者解释说,是博时基金最先看到了这其中的机会,而非蚂蚁特意挑选博时基金,蚂蚁方面想打造的是一个开放平台,不设置排他政策,未来会有更多基金和金融机构进驻。
“规模经济和范围经济不可兼得,蚂蚁金服一向追求的是规模经济,因此会缩小范围,把更多工作交给更专业的第三方去做。”袁雷鸣说,接下来将对外开放蚂蚁的金融信息服务平台。
对于眼下火热的互联网金融,其整个生态可以描述为,最底层的架构是渠道、技术、数据三方面,这也是BAT等互联网公司比传统金融机构更强的优势所在,在这个底层架构上面是引入的银行、证券、保险、基金等传统金融机构,再往上是由此产生的诸如指数基金、在线消费、交易保险等各种金融创新产品,其所对应的是最终面向用户的各种场景,比如购物、理财、保险等。
渠道、技术、数据,在以往互联网公司与基金等金融机构的合作中,更多的是开放其渠道和技术功能,直白地说是用互联网渠道帮助传统金融机构卖产品,比如支付宝可以为基金公司提供支付服务,而招财宝则为基金公司提供向用户销售基金产品的平台。
在技术方面,拿拥有云计算能力的蚂蚁金服举例,其每天处理30PB数据,相当于5000家国家图书馆的数据,这个计算能力提供给传统金融机构,可保障类似于“双11”的大并发请求顺利通过,不至于让金融机构的IT后台瘫痪。
而事实上,相比于渠道和技术,数据是互联网金融更具价值魅力的一环。像之前被批准筹建的芝麻信用、腾讯征信等民间个人征信机构,以及已开业的中国首家民营银行深圳前海微众银行,即将于今年6月份开业的网商银行,背后的精髓都是基于大数据。
在电商、社交、搜索等线上大数据外,这些互联网公司正在积极向政府机构靠拢,像蚂蚁搬家一样地将后者所掌握的线下数据(比如水电煤缴费记录、银行的用户数据等)拿到自己的平台上来,不断丰富数据源的目的是让大数据发挥的作用更趋精准。
在指数基金方面,除了这次发布的淘金100,此前百度也联合基金公司发布过百发100指数,新浪也推出了南方-新浪I100指数,与淘金100基于实际交易的电商大数据不同,这两家分别采用的是搜索和新闻热度数据。
在华尔街,像通过谷歌趋势搜索数据进行选股的方式已流行,某公司在谷歌上的搜索量变化可反映其股票交易量的变化趋势。也有多家私募对冲基金借用Facebook和Twitter的社交数据作为映射市场趋势和投资人情绪变化的因子,以此构成投资决策依据。
本报记者采访的多为互联网金融业内人士表示,与互联网渠道和技术对金融业务的渗透相比,大数据在互联网金融中的价值挖掘才刚刚起步,未来随着线上线下更多数据的打通,以及越来越多的传统金融机构拥抱互联网,数据经济将创造一张更宏达的商业版图。
以下是更多技术解读:
这100只股票具体怎么选择的呢?
第一步,蚂蚁金服对掌握的海量电商数据进行处理,包括买家数、买家数、商品数、价格、订单数、销量等一系列数据,形成大的数据池。
第二步,恒生聚源把线下数据补充进来,主要包括行情数据,行业资讯等,数据池更为丰富之后,在蚂蚁金服和恒生聚源一同建模分析后,这些数据可以得出“行业景气指数”这样一个打分“因子”。(6000个电商类目,可以对应到35个股票行业,1740个股票,大致占据A股股票总数的70%)
“行业景气指数”当然不是一个简单的分数,它里面有供需指数(代表供求关系,比较适合于互联网上相对成熟的行业,如纺织品);活力指数(代表行业的成长性,适用于互联网的成长性行业,如医疗);价格指数(适用于价格弹性较大的行业,如白酒)等。
第三步,博时的工作来了,行业景气指数相当于告诉我们哪些行业正在风口,然后,博时利用其在投资领域的经验和优势,对个股的基本面,如市盈率、三张表;以及市场交易情况(长期动量、短期动量、短期反转、交易量等量化指标)进行评价,编制成另外两个打分因子:综合财务因子和市场驱动因子。最终,根据三个打分因子,给1740个个股打分,得出分数最高的100只个股,采用等权重方式投资。
第四步:中证指数作为指数公司,接受淘金100指数的报备、审批和创立。
2.淘金100的核心竞争力和优势是什么?
1、数据质量
相对于以往的指数,淘金100最大的特色是提供了新的数据源:也就是电商大数据。源于互联网的数据并非替代以往基金经理对于财务数据和市场动态的分析理解,而是作为三个因子的其中之一,来做有效补充。
电商数据有什么优势?
1)全量数据:以往的投研方式主要是抽样调查,由于成本问题和可操作性,样本数量很有限,往往不全面不准确。电商数据虽然也不是全行业,但这是一种全量数据,样本数量极大。
2)数据深度和完整性:电商平台很多数据在线下是很难统计的。比如线上,我们知道多少人去点击、收藏、甚至把商品放入购物车,这体现了用户对于一个东西的兴趣多大。
3)时效与便捷:电商平台的数据是非常实时的,前面提到有三个因子,另外两个因子也很有用,但缺点在于相对滞后,比如说三张表,一个企业产生订单,进行生产,最后销售,过几个月形成财务报表,已经是相当滞后的结果了。而且,模型建立好之后,计算过程非常快速。以往做行业调研非常辛苦和繁琐,行业投研报告往往也售价不菲,美国甚至有公司用直升飞机航拍仓储的方式来做调研,有了互联网数据后,这一切变得更为简单。
4)反映实体经济:股市是实体经济的反映。而电子商务是行业销售的重要渠道,2014年网上零售额达到2.8万亿元,已经占到整体社会零售品销售总额的10%以上,而且互联网+是当前重要趋势,电商渗透率也能反映行业的革新速度。这次基金经理将电商数据与资本市场进行交叉验证,反馈电商数据对金融市场也有相当真实的反映,甚至是预测能力。
投资策略就是三件事:择股、择时、择行业,这次合作最主要是帮助基金公司择行业,未来可能做到更广更深。博时的基金经理反馈,淘金100的收益归因分析的结果,行业景气指数对于基金产品的收益贡献有30%左右。
2、平台能力
1)运算能力与技术能力:蚂蚁金服这次其实是搭建了金融信息服务平台,即维他命平台。在提供数据(脱敏之后的,也就是说数据是经过处理,看不出绝对值和单个用户信息)的基础上,还提供利用大数据的实验环境。比如淘金指数100个PB的运算量,一般的服务器根本运算不了,蚂蚁金服可以提供云计算能力。这就好比说玩大型3D游戏,市面上大多数的机器是286,这显然不行了,得用mac pro来玩游戏才ok。
同时,在怎样建模,怎样利用大数据这件事情上,蚂蚁金服有比较多的经验,蚂蚁微贷、芝麻信用都是很好的案例。蚂蚁金服希望做的事情是搭台子,开放数据,让大家一起利用自己的智慧来挖掘数据资产。
2)开放的态度:金融机构的专业,对于金融的理解,生产金融产品的能力,包括历经各种金融周期的考验等,都是互联网企业难以企及的。蚂蚁金服是一家互联网公司,要做的事情就是合作,让自己所擅长的互联网和金融水乳交融,产生美妙的化学反应。所谓金融服务公司,服务二字很重要。而且这次合作很深入,并非渠道的变革,是改变了金融产品的生产环节,意义尤其深刻。
PPT分享之一(蚂蚁金服产品经理神咒)
PPT分享之二(博时基金汪洋)
(本文本文来源于一财网、微信公众号蚂蚁金服评论等媒体)