庖丁解文:攻克世界科技难题后或成金融圈颠覆者
【环球网科技报道 记者 林迪】 有一个创业的故事,一位中国工程师了解到投行工作者的工作痛点,找来两个哥们一起创造出一个智能产品,在很大程度上颠覆了金融行业,重新定义了金融业;不可思议的是,该产品竟引来外国同行眼红并喊出“Sell it to me(卖给我好吗?)”,这个产品的名字叫“庖丁解文”。
事情的原委到底是什么呢?就在不久前,环球网科技记者走近这个团队并一探究竟。
灵感起源:金融从业者的困扰+市场的刚需
有一个大的背景,中国的债券从2015、2016年开始大发展,发展到现在新三板的企业已上万家,所以,现在的工作量已经远远超过以前的工作量,中国的金融市场发展到一定阶段,这个领域就会更加关注降低成本,比如说现在的会计师、审计师的工作,每天要审阅大量繁琐的文档,且与金融相关的文档多达几百页。
图:庖丁科技联合创始人兼董事长 林得苗
“我身边很多朋友是在投行工作,近两年,他们的工作量非常大,而且很多事情比较枯燥,审阅各种报表。从需求的角度,我就开始思考能不能用一些技术的方法去解决这些问题。”工程师出身,也是庖丁科技联合创始人兼董事长的林得苗告诉环球网科技记者,他与本就是朋友兼同事的罗平,一位中科院计算技术研究所博导、微信人工智能首席科学顾问一拍即合,并在一次会议上“邂逅”了该公司的第三位合伙人,辞职准备创业的资深金融人士、“海归”高大光。
因为连续创业,林得苗轻车熟路的仅用三个月时间就完成了全球首款金融文档结构化应用产品——AutoDoc,一个用AI取代人工智能提升基础文本工作效率的产品。基于丰富的数据资源库,通过深度学习,让计算机真正能够甄别、理解、关联、分析、判断人类语义;现阶段,先以金融垂直领域作为切入口,它的主要功能是金融文档内容及数据复核。即用户只需上传需要复核的金融文档,经过自动解析和比对,机器会自动标注出数据不一致的地方。
这个刚需不仅体现在量级、速度上,更体现在准确率上。记者获悉,一份500页的招股说明书,一位投行分析师至少需要2天的时间才能全面复核完毕;而庖丁的智能文档复核产品只需要20分钟的时间就能生成准确率高达99.9%的纠错报告。
为此,记者从网上下载了一份格力公司《2016年年度报告》进行检测,用时不到半小时。
为什么取名“庖丁科技”?公司创始人解释称,在创立时决定引用“庖丁解牛”的成语寓意:经过反复实践,以掌握事物的客观规律,最终能够高效的解决问题。彰显公司对AI技术的探索与熟练应用,团队对人工智能技术钻研与创新精神,从而掌握将文档结构化的AI核心技术,实现产品化落地,高效而便利。
技术核心:领先海外 攻克世界级难题
“2017年10月,全球最大资产管理公司贝莱德的代表来北京,我们在一起吃饭时,他直接问我,把你的东西卖给我吧(Sell it to me)。当我问是什么吸引他的,没有谈国内大家提到的技术和应用场景带来的超级数据,他说,‘我们需要这样的产品,而你们做了出来,我们可以真正的感受到它带来的好处。’”庖丁科技CEO、联合创始人高大光告诉环球网科技记者。
图:庖丁科技CEO、联合创始人 高大光
但他们骄傲地表示,做到这样并不简单,因为这是一个世界级难题。2017年年底在美国的AWS(亚马逊)大会上,大多数人还不知道什么叫自然语言转结构化。
庖丁科技首席科学家、联合创始人罗平指出,我们做的是让计算机读懂自然语言的内容逻辑,而不是语言本身(仅仅识别文本早已被广泛应用),怎么做到呢?就要对自然语言、表格进行结构化处理,让计算机能够读懂其中的逻辑,这是我们的核心技术,也是我们独创的。
图:庖丁科技首席科学家、联合创始人 罗平
为什么以金融业作为切入口?首先,在产品最初期,金融行业的文档或数据是社会公开的资料,在投入市场之前,对产品的优化是一个很好练习和升级。其次,金融行业是大量存在数据场景的行业,用处也最大。金融是一个容错率非常低的行业,有错的话损失太大。
“比如说IPO审核,会因为文档里一个数字有问题,就直接失去IPO资格,损失非常大,有的即将IPO公司的老板对错别字都是零容忍。所以,这个场景的切入点是金融机构的刚需。当然,我们把这些数字结构化之后,也会有更为广阔的应用空间。”罗平对记者解释道。
据麦肯锡的预测,未来三年高科技、通信和金融领域将成为采用人工智能的主导行业。金融行业作为一种高度数据化的行业,首当其冲成为AI最好的应用领域。作为百业之母的金融行业与整个社会存在巨大的交织网络,沉淀了大量包括各类金融交易、客户信息、市场分析、风险控制、投资等在内的文档数据。
老外为什么做不了?高大光表示,AI垂直领域的切入特别重要,美国一家法律AI公司已经帮助美国前十大的律所将部分律师替换成为AI系统,他们可以去读合同,瞬间抽取出有用的信息,他们特别想加入中文市场,但是考虑到汉语的复杂性和语言情境的多样化,以英文为蓝本的国外系统做不了。
另外,罗平指出,中国的技术实际上可以做英文的。因为英文相对来说简单,美国的证监会要求投行的人用最平实的语言来描述企业,他们要求写的每句话让普通大众老百姓都看得懂。所以用的语言都非常简单,那么做起来相对容易。
颠覆:金融科技到科技金融
在林得苗看来,庖丁科技的产品未来很可能会颠覆掉整个金融圈。
提到以金融领域作为切入点,高大光透露,他们是要搞大事情。他解释,今天的金融领域涉及了人类所有的经济活动,包括各个领域。实际上,他们是要把背后的资本市场,全球资金动态统计出来,从而在风控和市场预判上获得主动权。
“现在基于传统的知识图谱构建的新的资本图谱,能够把传统意义上金融投资机构在做的事情用计算机来代替,这也是美国现在做的。全世界最大的资产管理公司,管理万亿美金,它最害怕的不是像它一样的资产管理机构,而是Google、Facebook这样的公司,害怕它们的AI最后能够取代人来做投资,那意味着AI公司未来就是一个新的金融机构,我们要做的就是让自己成为新的资产管理机构。”高大光信誓旦旦地说,现在大家说的是金融科技,未来就是科技金融了,一家科技公司成了金融公司。凭着这个技术杀手锏,不需要太多人,就可以做投资。