快与慢(上):AI应用于投资领域的现状与未来
金融市场提供了无数种赚钱(或者亏钱)的方法。它们之间的一个重要区别就是投资期限,从几毫秒到几年不等。 胡桃算法(Walnut Algorithms)和全球系统投资者(Global Systematic Investors)是两家新型投资管理公司,分别是高频交易界和低频交易界的代表。
我采访了这两家公司的创始人,跟他们聊了聊投资、数据和创业挑战。本篇是我和胡桃算法公司联合创始人兼首席执行官纪尧姆·维达尔(GuillaumeVidal)的对话,后续发布的下篇将是对全球系统投资者公司联合创始人兼联合首席投资官博尔德·汉克(Bernd Hanke)的采访。
你们为什么给公司取名“胡桃算法”?
维达尔: 因为胡桃的形状像大脑, 而且从创业公司的角度来看,前有苹果和黑莓,今有胡桃,感觉会很有趣。 这个名字还是为了表示,我们有点像智能算法创造出来的胡桃树。我们觉得,把“算法”放在“胡桃”后面很重要。“胡桃”和“算法”的组合很有意思,寓意也很好。
你会如何概括你们的工作?
维达尔: 我们把最先进的 人工智能 应用在系统投资策略上。
这是一开始的想法,还是后来产生的?
维达尔: 我觉得自然而然就有了这个想法。六位联合创始人拥有人工智能、投资管理和金融背景,我们认为肯定有发挥我们专长的地方。 我们研究了很多AI创业公司,发现其中很多公司都在努力思索他们应该用AI来做些什么。 法国有一家优秀的AI创业公司,名叫Snips,就连他们都是好不容易才想出一款产品。
从一开始,我们就着眼于金融服务和投资管理,我们觉得这非常适合用AI来处理。 我们确实花了点时间来寻找合适的商业模式,我们现在的答案其实就是根据监管的规定来管理资金和提供投资建议。 但在刚开始的时候,我们有点天真地想:“我们要运用AI。”我们希望做到像DeepMind公司利用强化学习和AlphaGo所做的那些成果。
这些算法极为强大,我们希望把它们用在投资管理上,而这些算法最多才问世四、五年。要能对它们善加利用,不仅需要AI领域的进步,也需要其他领域的进步:对数据的获取,拥有恰当函数库的编程语言,以还有通过谷歌云或亚马逊云服务提供的算力。需要综合好多方面才能做到这一点。
我觉得,对我们来说最困难可能也是最幸运的地方在于,我们拥有这样的综合技能。 我认为,最大的门槛就是AI、计算机科学、量化金融和商业技能的结合。
你们专注于哪些金融工具?
维达尔: 我们专注于美国和欧洲的高流动性股票指数期货,因为我们既需要流动性,也需要很低的交易成本,做多或做空时不必支付额外成本。
你们是如何找到你们的商业模式的?
维达尔: 我们先是认定AI用于金融是可行的。这肯定能行,毫无疑问。问题在于,如何使它可行?这一点非常重要。是只搞分析研究,还是只做一种产品?是向对冲基金收取服务费,还是和一支对冲基金合伙?是被对冲基金吸收,还是提供交易信号?是从事咨询工作,还是创建自己的对冲基金?所有这些潜在的商业模式我们都曾经考虑过。
我们申请加入创业加速器Startup Bootcamp,在甄选阶段中,我们对他们说,我们还没有找到一种商业模式。他们对此并不介意。现在,我们在从独立管理账户入手。这在 金融业 已经相当规范化了。很多商品交易顾问(CTA)都在做这个。基金架构可能是要到更晚些才会着手的工作,因为会涉及到更多的合规和监管问题,成本会更高,也很耗时间。
用机器学习来生成交易信号有什么创新之处?
维达尔: 传统的系统策略是基于规则的。比如,你在Quantopian平台上编写一个系统策略,规定:“如果这三条移动平均线发生交叉,那么这个交叉点就是我的年度枢轴点。或者,如果我的相对强弱指标超过了特定的某个阈值,那么我就买进或卖出。”这些都是固定的规则。
而我们所打造的,是一种没有固定规则、更加灵活的机器。 机器学习算法能不断进化,真正着眼于市场配置,对不同置信水平的买卖信号进行分类。这有点像一个交易大厅,里面有很多交易员,就我们的情况来说则是有很多机器交易员,它们是一个个AI算法,然后有一位投资组合经理,担任资金的分配者,使用不同AI算法提供的潜在交易信号,根据风险约束和敞口约束、多头和空头、工具、地域等因素,对分配给那些信号的资金进行优化。
似乎你们的客户必须对AI足够精通到才能懂得你们工作的价值,但又不能精通到有能力自己做。
维达尔: 全球有8万多支基金。其中自然总会有一些对AI感兴趣,甚至还有对冲基金直接找上我们。但有些时候,他们只有一套全球宏观策略、一套债券策略或者其他某种形式的非系统策略。 我认为,内部金融工程师团队未必有充足的人手,来做我们一直在做的事。
以前,我们的所有代码就靠12个人来写,现在很快就要增加到15个人了,全都是科学家。我们得把整个基础架构的代码都写出来,我们还得做分析研究,所有事情都得我们自己来做。 很多传统基金有时会聘请一位博士,然后说:“就让他负责解决某一个问题,就让他用机器学习加强我们的其中一个系统。”
这未必行得通,因为你可能还需要创业公司身上的那种协作和创新文化,而不是临时聘请一位博士,与基金里的一位金融工程师合作,进行数据科学方面的工作。我们就完全是在一个紧密的团队里工作,一直在集思广益,让计算机科学家、数学家、AI专家一起思考什么真正有效, 什么应该可行,我们应该如何用代码实现,我们应该如何设计。这需要创新思维。
成熟的对冲基金一直以来用的都是自己的系统,可能能有20年那么久。他们有自己的策略,可能是长期系统策略,长期趋势跟踪策略或者其他什么策略,他们会很难提出全新的东西、雇用新型员工、引入内部研究。有的也会作此尝试。
可以说, 其中最精通AI的对冲基金取得了成功, 比如Renaissance Technology、TwoSigma和Winton。这个行业很不透明,我们未必清楚地知道谁在做什么,但可能他们有某种AI策略。
这些对冲基金的算法将在市场上和你们的算法产生竞争。你们是否有办法应对?
维达尔: 我认为主要有两点。一是我们暂时比他们小得多,我们所关注的资产类别也未必相同。 规模更大的对冲基金肯定处于程度非常深、流动性非常强的市场。这些基金很可能有大为不同的投资策略,多种多样的投资期限,所以他们能够进行从高频交易到年度趋势跟踪的各种投资。
当你的资产管理规模达到600亿美元时,你别无选择,只能把投资范围扩大到所有资产。而我们一开始的资产管理规模很小,我们可以对特定资产采取日内交易策略。
二是CTA的趋势跟踪系统通常具有80%到90%的相关性,因为它们会在同样的时间区间跟踪同样的趋势。 当你开始使用更加复杂的机器学习策略时,实际运用机器学习的方式可以有很多。我们想到的是模块化,所以我们会有数据采集、数据清理、特性工程、入场点和退出政策,有配置,有市场影响。
所有这些对我们来说都可以利用机器学习进行改进,实现自动化,而可以用来做到这些的具体方法实在太多,所以最终大家各自做出来的系统会有很大的不同。我们提供了一些新的投资方法,我们提供的一些交易信号不是人人都有的。
这并不是说我们的机器是会下金蛋的鹅,只赚钱不亏钱。 它也有风险调整后收益,也有回撤,也有内在风险,但从投资组合管理策略的角度来看,它的表现确实超过了其他的一些绝对回报策略, 并且和它们没有相关性。这就是人们感兴趣的地方。
你是否担心你们的模型过度拟合,在你们开发模型的时候奏效,但后来就不行了?
维达尔: 尽可能地减少过度拟合正是我们的工作重点所在。方法有很多。首先是数据维度,这就是我们进行日内交易的原因。我们试图掌握尽量多的数据点。在进行分类时,我们最大程度地减少特性向量,这实际上就是为了减少输入数据维度。
在这方面,运用人类专家的知识很重要。我们还开展大量的鲁棒性测试,设计鲁棒性模块。 在系统上线之前,我们也会进行虚拟交易。但某种程度的过度拟合总是存在的。因为你会使用历史数据,并且会让你的模型去拟合历史数据,这时就会产生过度拟合。一些拟合是有用的,因为你必须确保算法拟合当前的市场机制,但算法必须得经过泛化处理。
你们的算法能否意识到机制已经改变,还是需要人类的帮助?
维达尔 :能,我们做到了这一点的自动化。我们非常努力地在决策的多个层面实现自动化,不管是配置部分还是入场信号部分。 所以底层算法本身可能知道市场已经改变,并据此调高或降低信号的置信水平。但在配置方面,你可能会说:“某个算法给我发了某个信号,但我决定无视它,因为它并不符合正确的机制。”
因此,我们其实在多个层面都考虑到了机制变化。我们完全没有引入人类干预,除非发生重大事件,比如严重的金融危机或者闪电崩盘时,我们认为,这时算法可能无法正常生效了,我们应该把它完全关闭。
你是否认为未来的投资管理将被AI主导?
维达尔: 这个很难说,但投资组合管理人或者对冲基金负责人,可能会从原本的交易员、经济学家、商业人士群体,转向数据科学家、数学家,转向能够利用数据、理解数据、管理科学家和工程师团队的人群。鉴于AI正在变得更加容易获取,数据和算力也在变得更加容易获取。
你可能会看到像我们这样的公司不断涌现,并且颠覆规模更大的对冲基金, 而从某种意义上说,届时那些规模更大的对冲基金将被迫捍卫自己的地位,要么收购我们这样的公司,要么自己创新, 就因为他们现在没有真正做到这一点。
你是否认为,在未来的某个时候,应用于投资领域的AI将会商品化?
维达尔: AI不是自动的,不是单一架构。它不是“我做AI”这么简单。 我不认为AI将完全商品化。 这不像是“我有个AI算法,把数据输进去,它就能工作”。实际情况要复杂得多。你必须进行大量的特性工程,你必须拥有交易经验和市场经验,当中涉及到很多不同的参数和很多不同的方法。
也许会有某种形式的商品化,比如Quantopian平台在一定程度上成功实现了系统算法编写的商品化,吸引了很多人。但相比那些使用的都是同一个平台、获取的都是同样的特性与数据的人群,使用另一个不同平台的人群可能会更有优势。
这又把我们带回了AI交易团队理想构成的话题。
维达尔: 你需要交易老手、数据科学家和计算机专家,在基础设施、代码优化和执行方面,你都需要出色的IT人员。对我们来说,数据科学和AI差不多是一回事,但AI从业人员不同于AI研究人员。数据科学家知道如何写代码,知道如何使用机器学习函数库,而研究人员明白神经网络背后的真正原理,也许他们会致力于重写一个性价比更高的函数之类的,这就不是数据科学家会干的事。
当这些背景不同的人在如何进行下一步工作的问题上产生分歧,又会是种什么局面?
维达尔: 这很重要。我认为正是这一点令我们与众不同——整个团队的成员都是思想开放、能够整天争论的人,然后由最好的想法胜出。这是创造力管理,试图让所有人在一开始的时候提出不同看法,最后达成共识。
也要在优先事项上达成共识,因为我们总是有许许多多的想法, 一一实施的话需要无数的人手和时间。我们必须确定,哪些最容易实现?我们现在只要做些什么就能最大限度地改进结果? 然后,会有更侧重于技术的人员说“没问题,我能实现这部分的代码”、“这个要实现起来,需要写的代码会太长”或者“这部分我们该怎么用代码来实现?”
你对非传统数据来源 大数据 有何看法?
维达尔: 在AI和大数据之间,我们作了区分,但其他人往往没有这么做。 AI是一种让你发掘大数据价值的手段,但我们的重心放在AI取得的进步上。 例如,当AI变身围棋大师和雅达利公司(Atari)系列游戏的高手时,这些其实都是算法所取得的进步。这些都只是规模很小的数据集或者相当有限的数据集,但是真正取得了进步的是AI本身。
我们的重心是强大的AI,而不是另外的数据来源。 其中一个原因就是我谈到的数据维度问题。我们寻求的是在统计意义上足够稳健的策略。
其他行业对数据科学家的需求很大。你们如何吸引数据科学家到金融业工作?
维达尔: 首先,我们把自己宣传为一家科技公司。 而且所有在金融AI方面取得成功的企业和基金其实都是这么做的。看看Two Sigma、Winton和Renaissance Tech的宣传,他们实际上是在说“我们是一家科技公司,一家研究公司,只是碰巧从事金融交易”。这对吸引适当人才非常重要。
如果你只是一家对冲基金,人们不会真的愿意为你工作,主要原因就是金融危机的影响和对冲基金行业的糟糕名声。 但这份工作其实相当有意思。你会分析非常复杂的数据集。你会做各种研究,并且会有非常明确直接的应用。结果是好是坏,一试即知,黑白分明。优化代码,把数据科学应用于新的数据集、新的策略、新的市场和新的工具,每天都做着这样的工作,其实是很有意思的,可能要比在媒体公司做类似的工作更有意思。
从长远来看,我们希望能拓展到其他领域。 位于纽约的对冲基金Renaissance Tech,就被视为世界上最出色的理论物理实验室之一。同样,我们希望胡桃算法公司能成为世界上最出色的AI实验室之一。