做数据生意的“爱智慧”:华尔街“叛徒”的中国门徒
“让华尔街人神公愤的“叛徒”。”2014年,《福布斯》杂志给一家美国创业公司冠以了这样一个吸引人眼球的名号。当时,这家名为肯硕(Kensho)的公司成立尚不满一年。
肯硕(Kensho)位于马萨诸塞州剑桥市,由哈佛大学经济学博士纳德勒与程序员彼得·克鲁斯卡尔(Peter Kruskall)联合创立。它宣称将撼动金融分析行业,就像当初谷歌给搜索领域所带来的冲击一样。
比如,你可以像在谷歌进行搜索一样,询问一些复杂的问题——当三级飓风袭击福罗里达州时,哪支水泥股的涨幅会最大?当朝鲜试射导弹时,哪支国防股会涨得最多?当苹果公司发布新iPad时,哪家苹果公司的供应商股价上涨幅度会最大?Kensho的软件都能在短时间给你一个明确的答复。
其背后的黑盒子其实是机器学习以及知识图谱,机器学习系统通过抓取数据和市场信息,搜寻并建立起国际事件及其对资产价格影响之间的相关性,而知识图谱则提供实时的国际事件的画像。Kensho为平台信息配备了直观的搜索工具和数据可视化功能。
2017年,来自福布斯最新报道显示,Kensho已在B轮拿到了5千万美元的融资,由标普国际领投,华尔街最大的六家投行(高盛,摩根大通,美银美林,摩根士丹利,花旗集团和富国银行)都参与了Kensho的B轮融资。这家成立三年半的初创公司,总市值已经达到了五亿美元。
伴随着大数据、算法驱动的人工智能已经进入到金融领域,Kensho这位华尔街“叛徒”的成功经历正在吸引中国门徒的加入,智能投研成为一条火热的创业赛道,爱智慧科技正是其中的竞逐者之一。
这家志在对标Kensho的创业公司由华为公司离职创业、百米生活前CEO梁新刚创办。团队包含了人工智能、 数理统计和金融经济人才,以知识图谱和机器阅读为核心能力,帮助证券投资、医疗、 物流行业企业做经营仿真、预测,辅助决策,利用AI专家系统帮企业提升运营效率、辅助决策。
“整个IT就是excel”
作为一名围棋爱好者,梁新刚决定放弃上市公司CEO的身份的契机是2016年的那场AlphaGo与李世石的大战。在研究阐释AlphaGo算法的论文之后,梁新刚发现,人工智能确实已经达到了能与人类博弈的水平。人工智能对人的替代,来势汹汹,锐不可当。
但为何选择以证券投资作为主赛道?原因在于梁新刚发现了二级市场投资机构的“落后”面貌。在他看来,二级市场投资虽然看似光鲜,但仍是一个“相当传统的作坊式的产业”,尤其是小型证券机构的IT基础设施非常薄弱。Kensho公司创始人纳德勒同样也有类似的经历。其当年在美联储工作期间惊奇地发现,这家全球最具权势的金融监管机构仍然依靠Excel来对经济进行分析。
众所周知的是,传统投资方式主要是投研人员去上市公司调研,了解财务数据、行业信息等来做投资决策。他们所主要依靠的投研工具仍是万得等金融数据服务商,而目前的金融数据提供商只能提供数据资讯,其商业模式也是以卖终端或者卖数据库为主。
这正是智能投研的机会所在。
智能投研,指利用大数据和机器学习等技术,将数据、信息、决策进行智能整合,并实现数据之间的智能化关联,从而提高投资者工作效率和投资能力。简言之,以AI辅助投资机构进行投资决策。
观察爱智慧旗下的金融投资分析问答系统“查尔德”的表现,或许可以一窥目前国内智能投研的产品现状。
在“查尔德”系统输入热门话题、重要事件,系统可自动联想历史相关新闻事件,以及相应时间段的股票走势,提示当下有哪些股票值得关注。
在该系统输入热门投资领域的关键词,如“化工”、“能源”,还会显示该行业上下游产业链、行业动态、原材料价格走势以及投资建议。
梁新刚介绍,“查尔德”采用了事件驱动型投资策略,分析A股基本面资讯对上市公司股价的影响并加以量化,将数据信息转换为投资信号。所谓事件驱动型投资策略,就是通过分析重大事件发生前后对投资标的影响不同而进行的套利。
在梁新刚看来,与传统数据资讯提供商相比,智能投研的最大优势可以带着投资逻辑服务于专业客户群体。如果广泛加以使用,沃伦软件可以撼动长期以来被彭博社和汤姆森路透社(Thomson Reuters)所垄断的260亿美元的金融数据市场。短期颠覆传统金融数据提供商可能性不大,未来金融数据服务市场创新空间巨大。
梁新刚认为,通过海量数据、知识图谱和深度学习能力,机器可以发现事件与事件之间的关联关系,并通过知识图谱实现信息向决策的一步转化,并且这种转化过程是可以通过机器学习逐步自我优化的,甚至可以说会比人类做得更好。
孵化试验田
虽然理论上的前景光明,但在Ai+投资的实际落地中梁新刚遇到了不少难题。
首先,如何实现行业壁垒的建立?
AI自底层向上侵袭
关于智能投研行业,梁新刚描绘了AI从底层向上侵袭的发展路径:机器学习、自然语言处理、知识图谱、增强学习等技术分别对应数据、信息、知识、决策等渐进的投资层次,层层推进,越往金字塔顶端实现的难度越高。行业优势的建立只能通过这一层一层的推进。
梁新刚对这一推进脉络进行了具体解读:
- 在数据层,数据源基本一致,行情数据皆来自于交易所;而机器学习、深度学习技术的算法公开,技术本身的差异不大。
- 在信息层,通用型自然语言处理并不能适用证券行业的深入需求。要想实现对于海量财经新闻资讯的去重合一,只能依靠团队自身实现。去年5月,爱智慧以中文自然语言处理为核心支撑的A股事件驱动才正式上线,其团队负责人来自微软小娜团队。
- 在知识层,最关键的是知识图谱的构建。所谓知识图谱,即是将人类的知识体系外在化,旨在描述客观世界的概念、实体、事件及其之间的关系——简言之,就是谁是谁的“爸爸”,谁是谁的“儿子”,这些概念之间的关系。运用在证券领域,即依靠知识图谱可以实现推测宏观环境和产业板块演进的能力。但知识图谱的构建无法通过自动化实现,耗时长且需要大量人工参与,因此谁先构建完成谁就具备先发优势。梁新刚称,爱智慧已优先构建了证券投资领域规模最大的知识图谱。
梁新刚面临的另一个问题是,对于一家证券行业面对B端的创业公司来说,如何自己趟业务是一个难题。
一方面,AI系统对于基金业绩的影响很难得到如实的反馈。梁新刚称,基金经理倾向于将业绩的良好表现归因与自身决策,而表现不佳则归因于AI系统的“不靠谱”,很难真正界定AI的价值并且找出问题。
另一方面,证券行业很难贴近客户。“在华为工作期间,我甚至可以睡在客户的机房内,新系统如果出现bug可以连夜修改,但是证券投资机构不允许近距离观察。而直接问AI方面的需求,很难问出来。”梁新刚说道。
这让梁新刚意识到,不自己操盘一只基金是难以获知甲方的真正痛点所在的。因此,梁新刚决定发起一只规模为5000万的阳光私募基金,这只基金将应用“查尔德”系统,被梁视为自己的“试验田”。目前,该基金已经在备案中。
梁新刚坦言,创业一年半以来,公司的主要营收来自向医疗、物流行业企业销售软件授权,针对证券行业的“查尔德”系统仍处于免费试用的阶段,而最新的收费版本正在筹划上线。“毕竟,客户愿不愿意付费才是判断你的服务质量的最重要标准。”梁新刚说道。(本文首发钛媒体,作者/蔡鹏程)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App