烯牛数据CEO李锦香:大数据助力一级市场量化投资
如今,随着社会不断发展,技术不断进步,国内外各大金融机构已经在 大数据 、 人工智能 、 区块链 等新技术上有很多尝试,智能客服、智能投顾等新金融形式也早已不新鲜。那么,这些前沿新科技遇到严肃谨慎的金融业,究竟是“黑科技”般的存在,还是技术宅们的另一场狂欢呢?
4月25日,由数据猿主办的《当金融遇上黑科技》线下主题沙龙活动在上海腾讯众创空间顺利举行。活动上,来自传统金融机构、 金融科技 领域新秀、大数据与人工智能专家等一众大咖汇聚一堂,畅聊了大数据、人工智能、区块链等“黑科技”与金融业的那些事!
以下是由数据猿精编整理发布的 烯牛数据 创始人兼CEO 李锦香 的精彩分享:
今天要跟大家分享我们在 一级市场 中量化、投资的探索。 刚才主持人说到量化投资,大家第一反应都是二级市场。一级市场到底能不能用量化的方式让机器自动投资,我觉得答案肯定是不行的。
主要是因为一级市场的数据极不透明,而且公司大量的信息是存在文本当中的,本身对信息提取就很困难,甄别就更难了。
我们希望通过大数据的方法,帮助一级市场的创业公司或投资人,进一步提升工作效率。这是我们的定位,或者说是在探索一级市场的量化投资。
我们公司2016年6月份成立,现在快一年了了。我以前做过VC,也做过管理咨询和百度的产品。我们技术团队有多年经验的CTO,也有数据科学家。
为什么我们想做这样的事?说实话,我在创业的时候没有想太多,主要是因为我2012年开始做投资,当时VC还是一个让很多人觉得陌生的事情。包括很多创业者找我融资的时候,我要给他讲天使轮和A轮有什么区别,当时很纯粹的大家从天使轮做起,然后A轮、B轮、C轮,之后该上市上市该倒闭倒闭了。现在融资也很复杂。天使轮之后有PreA,B轮之前有一个PreB。
在市场发生巨变的过程中,投资人以及投资机构的工作效率变得越来越低。但是他们的工作方式是一沉不变的,甚至越来越懒。因为围绕投资人的业态开始纷繁复杂起来,媒体也越来越多。
这个时候我就在想为什么不能用机器提升效率,比让投资经理做的常规任务:每天更新表格,筛选符合我们的项目。这个工作就可以让机器来做,所以我就有了烯牛数据。我们7月上线,11月拿到了天使轮,然后开放注册。
首先我们需要一个数据库。 2015年你之前,是IT桔子独霸天下。但是从下半年开始,出现了大量和我们类似定位在一级市场的公司。有这样的变化,我认为很大程度是因为数据源增加了。2014~2015创业火了,大量的业态生产,随之而来的就是和创投有关的数据源增加。
我们底层数据库大概有20万家左右的创业公司。从新增量的角度来说,每天新增公司两三百家;从新闻角度说,每天新增的新闻条数大概六七百条。存量和增量上,2015、2016年探索数据库的公司大家做的是差不多的,有很多爬虫扒完做聚合,区别是应用场景不一样。
我们的核心技术是投前发现领域。 我不鼓励用户只是把数据库用来搜公司名。我们希望将数据库应用在投资人早期找案子的过程中。大多数人在看项目的时候都会有自己关注的领域。比如现在大家关注的人工智能,能不能有产品可以提供这个领域的公司,多少家团队比较好,最好还可以看到业绩比较。
所以,我们在数据库的基础上做了一些所谓的量化分析,量化投资的探索。我们用标签体系做探索,共有两大类标签:一类是灰色的描述性标签;一类是评价性标签。这是我们烯牛的特点。
通过描述性标签可以知道这家公司的业态,同样可以看到类似业态的公司。通过评价性标签,我们可以知道这家公司团队是否优秀。
另外我们还有一个探索。 有的人希望设定好关注的领域,机器可以直接搜索符合条件的公司,理论上不会错过任何一个好的项目。这是我们做的非常好的功能私人订制。当然这也是基于标签的。
我们还会对整个行业进行追踪 。我们抓取了市面上近百个媒体源做了一个根据行业的自动分类。选择行业后,相关的新闻都能够及时的看到,有点像创业版的今日头条。
关于我们投前投资人找项目这块的产品设计,不光投资人在用这个产品,包括很多创业者也在用。很多人通过私人订制的功能监测自己的竞争对手。因此,应用市场不仅仅局限于投资人。
而投中推进就只局限于投资人,这是我们做的一个面向投资机构的项目管理功能。它最大的亮点就是一键录入。 我们还有投后管理,它最大的特色就是追踪。往往很多投资人把钱投出去后就不太管这个项目了,这是很危险的。我们会有机器帮助追踪你投资的公司是不是有异动。这个功能未来会开放成一个更广泛适用于更多的人功能,这可以认为是类似创业版情报的东西。
另外还会有我们内部管理的模块。 这个其实是统计,但又不仅仅是统计,因为核心还是基于大数据。来去对早期的非上市的公司,基于文本做各种各样的处理,表现的形式,很大的核心是标签。我们去评价它、描述它,我们在上面叠加一些功能,帮助大家做基于数据的发现和追踪。