通联数据薛昆:算法改变世界,机器智能时代如何进行投资管理?

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

雷锋网报道,在近日深圳举办的预见2018新财富新春投资策略会上,通联数据金融工程董事总经理薛昆带来了题为“ 机器智能时代的投资管理 ”的主题演讲。据雷锋网 (公众号:雷锋网) 了解, 薛昆曾任瑞士银行投行全球量化团队董事,摩根大通量化研究团队副总裁,拥有十余年量化投资、金融平台研发经验。

通联数据薛昆:算法改变世界,机器智能时代如何进行投资管理?

通联数据金融工程董事总经理薛昆

以下是薛昆演讲原文,雷锋网作了不改变原意的编辑:

算法改变世界

今天我会结合行业趋势和热点来分享这个话题,比如区块链。 抽象来说,人工智能以及区块链最终都是算法,现在的算法已经应用到大部分行业,潜移默化改变我们的生活。

未来五到十年,金融行业、教育行业、汽车行业都会经历算法帝国的崛起。 总结来看就是三个方向:在线化、智能化、网络化。

物联网极大扩张了数据边界,以后的数据会越来越多,现在只是一个起点。比如当新能源汽车、自动驾驶汽车在今年普及开来以后,数据的边界将会超过手机边界。以后能够产生数据的模式将是非常有吸引力的模式,因为在未来数据会变成最重要的生产要素。

在线化和网络化会使得数据极度扩张,区块链和AI技术将会极大推动这个进程。在任何一个产业,“黑洞效应”都会使得产业链蓬勃发展。 而在智能化和网络化当中,最重要的是两个技术:区块链、人工智能。

区块链与人工智能

从2008年比特币白皮书发布,2015年以太坊诞生,到如今,区块链世界发生了翻天覆地的变化,也涌现出了很多区块链2.0技术。今年有一个非常重要的趋势——区块链将从2.0过渡到3.0阶段,3.0会带来更快的网络。

另外一项重要技术是大数据与人工智能。大数据与人工智能存在差异,但是在概念上两个联系紧密。因为人工智能依赖于大数据,如果没有数据,很多算法都只是流于表层。语音识别、自然语言处理、Chatbot、知识图谱,底层都是依赖于大数据,离开大数据,这些都是无源之水。

在自动驾驶领域也是如此。我们可以看到一个趋势,相关公司现在也越来越趋于自己去收集数据。现在BAT、谷歌可能会说,“我来给你提供算法,然后你到我的生态系统里面玩。”但是更多企业希望自己掌握数据,自己设计数据,数据直接上云。拥有这种技术的公司,未来会有非常高的壁垒。

如何将AI应用于投资管理?

一直以来,投资研究有两大门派,一个是基本面门派,一个是量化门派。AI又能为这两大门派做什么呢?

助力基本面研究

举一个例子, 在A股市场,每天都有超过50个上市公司的资本运作事件发生。中国工商登记注册的公司数1000万家,涉及的核心自然人超过500万。如果人工地去分析资本运作,基本上是不可能的。但是机器可以非常容易地帮助人类做到这个事情。

知识图谱可以帮助我们研究基本面。 首先要有基础数据,即新闻公告研报数据、交易所披露数据、工商登记数据,这些是AI的原料。然后我们利用知识图谱用实体识别算法,可以把公司高管作为实体抽取出来,并抽取投资持股关系等,形成公司关系图谱。有了这些数据以后,我们可以做关联分析,比如同业竞争关系分析,高管能力均衡分析,实际控制人的分析,并且动态变更。

助力量化投资

在量化投资领域,机器可以帮助量化研究员更好地挖掘数据。 传统投资研究,大家关注的都是各种结构化的数据。结构化的数据带来的信息是有限的,大部分投资者都能看到这些数据,所以你没有提前效应。但如果在卫星图像上应用AI算法,比如实时监测券商营业所门口的车辆数字,那么我们可以更早获得一些帮助

另外,我们也可以用算法挖掘文本数据来辅助量化投资。面对海量的文本数据,包括新闻、公告、研报、微博、雪球、股吧、互动易、论坛等,我们使用知识图谱进行关联分析。比如说,贾跃亭在回函中表示无力履行无息借款与增持承诺,“深表歉意”!通过情感分析算法,我们知道这样的文本是利空的,这样就可以帮助投资人很快的进行判断。

怎么做到的呢?我们使用的算法是WordEmbedding+BiLSTM-CRF,召回率均在90%以上。而基于情感辞典的算法和基于机器学习的自动分类算法,我们可以做到情感分析,自动分类处理。情感分析算法主要采用 XGBoost、SUM,情感分类准确召回率可以在75%以上。

助力大类资产配置

除了基本面研究、量化研究,算法在大类资产配置也能发挥作用。

比如,在构建公募基金组合时,我们可以用机器学习去做基金收益率的预测,并基于历史数据做统计风险模型。我们可以针对不同目标,产生最优的基金组合,比如说目标风险下收益最大化、目标收益下风险最小化。

此外,还可以进行基金特征选择。首先对所有的基金打标签,我们给每个基金打上大约150个标签,这150个标签包含8个时间维度。然后用机器学习算法去做筛选。比如,我们可以计算基金池中每只基金当期收益率与前期各性能指标之间的相关系数ic,这是量化里面通用的算法。如果再往前滑动多期,得到每个前期性能指标与当期收益率的ic序列,再计算分别计算每个ic序列的均值ic序列得到最后结果。

总结一下,机器学习虽然有用,但是也不是万能的。它的优势在于,它能够建立非线性模型。当然问题也是随之而来的,简单模型的解释度更高,人们更理解。所以大部分基金经理还是会选择线性模型,因为比较容易理解。 但是在一些特殊领域,比如知识图谱,这是人脑没有办法掌控的,那就需要人机结合。其实人对小数据是更敏感的,有一些人做不了的事情可以用机器帮助我们。

Q&A:

Q: 智能投顾对分析师带来的挑战主要体现在哪些方面?它还有哪些方面可以改进?  

A:智能投顾对分析师带来的挑战更多体现在智能投研,因为智能投研跟分析师是相辅相成的。 虽然机器算法的崛起替代了很多初级分析师的工作。但是高级分析师无法替代,人对趋势的判断和另类信息收集的能力比机器更强。未来的趋势是,算法取代初级工作, 高级分析师是如虎添翼。

通联数据薛昆:算法改变世界,机器智能时代如何进行投资管理?

随意打赏

数据结构与算法机器人算法机器算法遗传算法
提交建议
微信扫一扫,分享给好友吧。