Datafox为投资人筛选创业公司提供了解决方案
Datafox是一家位于硅谷的创业公司,它提供了一个针对非上市公司的实时更新数据库,试图为投资人解决这么几个问题: 从哪收集创业公司数据;到底收集哪些数据;收集来的数据如何确保很新很完整。
联合创始人Bastiaan和Mike Dorsey都是金融出身。为什么转到科技领域来创业?“因为我自己之前在高盛ESSG的三年,一直有一个很头疼的事,就是如何搜索中小私企的资料。” Bastiaan告诉 36氪 :“实际工作中很多同事都很苦恼,我觉得非常需要去解决这个问题。”
Datafox的基本功能是 自动化地从两个渠道获取数据 :
- 搜寻网络信息,通过语义分析等算法找出有价值的部分。
- 跟Crunchbase、AngelList和LinkedIn的合作,直接从这三个拥有大量创业公司资料的数据库获取数据。用户要做的是搜索感兴趣的公司,点击关注,或者跟踪别人分享的行业列表,比如Social Networking和Robotics。
在Datafox的首页,会看到创业圈的新事件,内容是Datafox根据用户关注的公司定制化的。同时也可以选择事件的类型,包括融资、收购、IPO、估值、收入、人才和新闻报道等。
在公司搜索界面,可以通过各种条件来筛选结果,比如运营情况、行业、地点、投资者、员工数量、财务状况、融资阶段等。公司界面除了传统的信息外,还有关联LinkedIn选项以方便与该公司建立直接的联系。
除了基本的数据获取外, 有两个很值得一提的plus:
- 首先是 Datafox Quality Score™ ,这是由一套 由专有算法实时评估创业公司然后得出的一个综合分数,细分有企业成长分数和HR人力分数。 目前他们使用20个以上的参数,包括招聘速度和方向、留存率、创始人背景、董事会质量、投资人质量、融资数量、用户评价、社交网络活跃度,还有其他网络分析指标等。
- 另一个是 关系可视化 。如果你想知道 某个公司在市场上跟其他类似公司在相似度、收入、融资或员工数量方面的关系 ,可以点一下Visualize按钮,Datafox就会给你呈现一张简单直观的网络图。在这张图表里,你可以通过连接了解这个公司在行业里的位置、潜在投资对象、谁是未来的合作伙伴、谁是潜在的威胁、谁可能收购这家公司等。
目前Datafox的实时数据来源有三种。一是 公开的信息 ,比如新闻、RSS feed、YouTube等。另一种是 现有的数据库 ,比如跟CrunchBase、AngelList、LinkedIn等。最后一种是 Datafox自己进行的数据分析 ,比如像之前提到的网络图等。Datafox的数据相比传统数据库来说的特点就是自动且近乎实时。
Datafox的目标用户除了投资者,还有分析师、销售等。这收费模式是按月订阅型:初级用户每月$49,100家公司、3个领域;专业用户每月$399,没有限制;企业级的会提供API以方便跟其他应用的整合或定制开发。
和湾区这边不少创业公司一样,由四名联合创始人构成的核心团队是清一色的Stanford背景。 Bastiaan Janmat在高盛伦敦做过三年的投资相关工作,Mike Dorsey有MBA和工程双硕士学位。产品上线后拿到Google Venture 180万美金的种子轮,随后startX、innoSpring等硅谷本土孵化器在内17方共同投资了其第二轮种子基金。风投一致看重的是这个给投资人搜索创业公司提供的全新的解决方案。
以下是Bastiaan对 36氪 的口述采访,我感觉他本人和这个产品本身的气质都像一只敏捷但很真诚的狐狸,整理如下:
我很头疼不能够有一个很高效的途径来搜索非上市公司,其中包括很多的创业公司。和很多华尔街的朋友交流,他们也告诉我说, 有一个明显的事实就是越来越多的公司选择了私有和暂时不上市 。查找这些公司的资料是困难的,我们需要手动寻找那些信息然后放进表格里,很麻烦,所以我一直在寻找可以自动化的办法。
Datafox是我们几个人的一个业余项目。当展示给一些金融界人士和硅谷的风投后他们都表示Datafox可以帮助他们节省大量的时间,于是我们很快就拿到了Google Venture的种子轮。
过去10-15年间,分析师、销售和风投的工作由于网络的原因而变得简单了,但同时网络也带来了信息噪音。所以我觉得他们需要的是 一个在数据之上的工具来收集整理并过滤呈现出关键的信息 。Datafox就是个具有 数据聚合、清理、特征提取、语义处理 等功能的工具,告诉用户他感兴趣的公司做了哪些他可能会更感兴趣的事情。
我们希望通过采集到的 大量数据 并综合 行业知识 和 机器学习 找到 一个能够准确评估公司运营情况的公式,并以分数的形式表现出来 。这 有点像市场指数或者Google的PageRank ,这个分数标志着一家公司在某个行业里的相对水平。
从投资者的角度来思考,我们尝试覆盖一个公司的所有对潜在投资者有用的数据,像团队、财务、客户、合作关系、媒体覆盖等。我们同时也从销售和业务发展的角度去考虑,因为他们能够发现一个公司是否有强劲的潜力。Datafox数据的涵盖范围很广,类比CrunchBase主要关注融资数字,我们会提供一个完整的画面。
老实说,我们目前也还存在一些问题。比如,法律并没有规定私企必须上报并公开公司信息,所以Datafox 一时不能保证信息的绝对完整性 。我们能做的就是收集整合散乱在网络各处的公开信息,并经过了自己的算法后呈现给用户。 目前Datafox允许用户报告有异议的数据 ,我们在 未来打算引入类似信心指数等 更加有效的方法来帮助用户决策。
目前我们使用了 20多个特征 。包括 留存率、创始人背景、董事会、投资人、融资情况、用户评价等 。 分数范围是0到1250 ,越高越好,说明越接近我们定义的“成功”的公司。
我们想成为 原始数据之上的分析层 。以后我们打算允许用户添加其他的数据源到他们的Datafox账户,然后我们会帮助分析和可视化那些数据。形式可能包括分析工具和研究报告。
当还在高盛的时候,我就非常羡慕做企业的人。他们拥有丰厚的管理和运营经验,能做出伟大的产品和服务。这也是我来到Stanford读MBA的原因之一。我在高盛做的是投资相关的工作,现在做的是服务于投资者的产品。我觉得之前的背景对我做这件事情有很大的帮助。创业的时候你会感觉拥有整个公司,负有很重的责任,大家团结一致达成一个目标的时候会获得很强烈的情感冲击。
我当然打算以后扩展到中国去,不过我们首先得解决语言问题,对中文做语义处理对我们的技术团队是个挑战。另外就是中国复杂的商业环境,我们还需要多了解一下。未来我们肯定是希望能够进行国际化扩张的。
[ 36氪 原创文章,作者: 曾小苏Clara]