达晨创投窦勇:投资人眼中的大数据生态和“独角兽”估值
2017年12月,国家提出数据治理,行业振兴,从低谷期爬了起来。
创业家 & i黑马 讯(李夜)8月31日消息,由南京市鼓楼区人民政府主办、鼓楼高新区管委会、鼓楼区发改局(经信局)、创业黑马、i黑马旗下企业服务垂直媒体B2B圈联合承办的“中国独角兽(秋季)峰会”今日在南京举行。达晨财智业务合伙人窦勇出席活动并发表主题演讲。
窦勇表示,达晨财智在大数据领域,从6个维度,布局了10亿投资金额,并投出了30家左右的大数据项目。目前所投项目次轮获取融资平均金额达到4000万,企业平均整体估值上涨5倍。窦勇讲述了我们耳熟能详的大数据、云计算和人工智能的关系;同时,分析了在一家专业投资机构眼中,大数据1.0时代的发展现状、投资逻辑和企业估值。
在窦勇看来,“数据本身并不具备价值”,只能获取信息。信息经过加工、经过整理才能总结成知识,并通过应用诞生智慧,智慧使用过程中又会形成数据,所以这是一个迭代循环。而存储成本的降低和计算性能的提升,则驱动了大数据产业不断更新。
以下是窦勇演讲原文,经创业家&i黑马整编删减:
我了解到,“南京鼓楼高新区正在全力贯彻实施“121”战略,加快建设创新名城引领区”,所以,我很高兴接受主办方的邀请。
刚才,主持人介绍达晨创投时给出了“著名投资机构”的标签,我就用四个数据来解释它。达晨至今成立18年,目前管理基金规模226亿,累计投资企业456家,其中IPO上市71家。
今天的会议主题标签是大数据、云计算、人工智能。那么今天,我们就从投资人的视角来给大家分享一下,这三者之间到底是什么样的关系。
一、云计算、大数据和人工智能
1、云计算
实际上,云计算很简单,云计算的目的就是把资源进行合理调配,主要实现空间跟时间的协调效应。简单讲,云计算就是让一台台物理机有了联系,让用户能够简单的获取计算、存储和网络资源的技术体系。从物理层面看,企业计算中心的10台、100台或者更多的服务器的集中,实现了时间资源的弹性,但对空间的弹性相对较弱,于是乎,虚拟技术的出现解决了空间资源的屏障,但同时也带来部署实施的难度。人们就开始想,能不能偷懒,能不能有一个单独算法,让机器来管理机器,来搭建基础框架。这就有了云计算的基础IasS。但光管这个还不行,还得开发应用。中国人都以实用为主,比如现在的电商,双11有可能有几亿人同时间进行购买,对服务器要求就比较高,这里面牵涉到另外一个层面Pass层,服务器上跑一些应用,让技术软件得到扩展也就是Sass层。云计算也就诞生了。同时也出现了私有云、公有云、混合云等多种形态。
通俗讲,什么叫私有云?服务器放在自己的企业里面的,叫私有云;服务器放到云计算提供厂商里面的就是公有云。混合云,就是我既用公有云又用私有云,把一些不涉及公司核心资产,放到公有云上,涉及到核心资产就放在家里的私有云。
2、大数据
接下来是大数据。关于数据,大家可以思考一个问题,数据有价值吗?我认为,数据没有价值。为什么?数据为什么现在提得很热,数据背后只有总结了,才会有信息;有信息再加工、经过整理才能总结成规律;有了规律还得应用才会有智慧;智慧使用过程中又会形成数据。所以这是一个迭代循环。
自古以来,数据都存在。为什么这个时代数据架构这么大?这受益于两个方面,一个是计算性能,一个是成本。80年代接触不到互联网,接触到的无非是报纸、电视或者收音机。那个时候,大家没有发现数据背后的价值和意义。但是种现象随着IT技术的发展在变化。2005年,美国雅虎为了解决了网页搜索的技术瓶颈成立项目小组,最后诞生了两个比较关键的技术,一个是分布式存储,另外就是高性能计算。2009年splunk上市把行业热点带动了起来。
国内的大数据热应该是在2014年开始的。到现在基本5年一个阶段。在数据1.0阶段,我们解决了几个问题,主要是认知,什么是大数据。刚开始提到大数据,很多人认为数据无所不能,通过数据可以解决所有问题;第二就是有些人认为大数据有一些价值。随着市场不断地迭代和演变,从资本角度来看,它对行业产生的推动是什么?2015年有了新三板,2016年国家又推出了网络安全法,大数据行业经过多年反反复复的演变,现在回归到本质。
回到开始的问题,大数据的本质是什么?就是一台机器干不完的事情,就让多台机器同时完成。
大数据和云计算是相关的。云计算厂商会讲数据平台给到我,我所有的数据都放在云计算上,互相是交融的。大数据需要云计算提供平台支撑算力,云计算需要大数据进行落地应用。
3、人工智能
现在,人工智能也比较热,但人工智能也很简单。怎么讲呢?人总是很想偷懒,总想通过机器等方式让我们生活得更加便捷。一开始,人的想法也很简单,我教机器规则、方式,机器一学就可以了。这里面有一个问题,我们低估了事情的复杂度,比如女朋友跟你讲如果我早来了,你没来,我等着;如果你早来,我没来,你等着。机器这样学习五年,只能叫专家库。但这样不行,这和人的独立思考是不一样的。所以,这驱动了神经网络的发展,有变化,机器会自己去调整。
二、大数据行业的机会
那么对整个行业来讲,再过五年,会怎么样呢?
在数据1.0时代,我们认为这是一个差异化显现的时代。现在,数据格式已经发生了很大的变化,语音、文本、图片都成了数据。在这个行业里面,大概有三波人在创业:一波人掌握了技术;一波人拥有了稀缺的数据资源,自然就有了数据机会。第三波人从国外回来,或者从高校里出来,掌握了先进的数据技术。这三波人构成了过去五年国内大数据企业基本的生态图。
从产业角度来看,我们把数据分成三类。首先,消费大数据。坦白讲,消费领域,中国互联网已经把坑都占了,互联网数据获取比较容易,可以用爬虫大规模调用网络数据;公开的网站数据可以通过技术调用;数据变现也比较快,比如网络精准营销或者一些金融方式;
第二类是机器大数据。第三类就是工业大数据。富士康刚上市,整个产业还处于非常早期的阶段,懂IT的有几个愿意去工业企业?中国制造2025靠什么来驱动?在高新技术方面,我们跟美国还是有差距的。如果拼机器大数据,大家可以学德国的工业4.0。中国的服务靠什么?靠数据服务。数据服务能够降低客户服务成本,能够实现商业模型得快速转变。未来,国内制造业是万亿级的市场,现在有大批人的进入,如果想要创业或者转型是比较好的机会。
数据1.0时代在2013-2014年左右萌芽,2015年泡沫加速,之后又进入到泡沫破裂期。行业的低谷在2016年出现。2017年12月,国家提出数据治理,行业振兴,从低谷期爬了起来。使用数据的时候,大数据产业才会得到进一步的支撑。无论创业或者投资,你都要面临如下问题:数据从哪儿来,来了怎么放,放了怎么用。还有数据的可视化问题。数据是无形的,你要把无形东西通过有形的表达方式让人接受。
三、大数据企业的投资逻辑和估值
谈谈大数据企业的价值。很多大数据企业可能有这样的想法:我们是非常牛的行业,企业中有科学家,也有重量级的客户,企业的身价是不是要贵很多?坦白讲,在轻资产里,没有几个大数据企业敢说自己有很好的盈利、在过去赚了很多钱的。没有盈利,财务风险怎么构建?你觉得赚了十块钱,但实际上只赚了八块,最后,还是要参考双方的资源进行估值。有什么估值模型去解决这个问题么?现在市场还没有发展出来。
因此,我们只讲一些案例,不讲技术,讲讲我们是怎么看这个行业的。例如有一个大数据企业,它是提供服务的,它面临的问题是什么呢?我们去项目现场的时候,企业需要给我展示一下,但搞笑的是,它告诉我机器坏了,于是,现场没有任何展示。
另外一家公司,直接拿了国外的大数据架构,来讲底层和技术、图谱之类的,业务还是应用集成,把系统拨开看业务,数据只有几百万,谁敢投吗?
另外一个案例,这个公司号称有10PB以上的数据,但只有公司老板知道数据哪儿来的,包括技术总监没有一个人知道这个数据来自哪里,而且数据使用权只有老板开放的时候,你才可以用,不开放的时候不可以用。但如果你私底下与员工交流,小到一个前台都可以给你拷一些数据。
所以,数据本身没有价值、挂羊头卖狗肉的企业有很多。乱像丛生的时代,总会有企业号称自己怎么样,但实际上并不是这样的。数据量不是越大越好,脱离场景的数据毫无价值。
要注意:1、数据的价值在于融合场景,而非数据量的多少来衡量其价值;2、融合场景的数据才能产生价值,基于场景的数据才具备应用能力。
我们还接触了一个案例,这家公司2016年收入3000万,接触的时候,号称2017年估值3个亿,为银行提供数据业务。这个案例估值10个亿,投还是不投?很搞笑是什么呢?2017年,真正的数据业务只有不到几千万。过去大部分数据企业还是2B业务,就像男孩子玩游戏,一关一关玩。2C可以指数级增长,但做数据企业,目前80%以上的企业,都在为企业服务,不可能从3000万一下提到3亿。不可能一下子涨很多。
最后,说一句,创业一条很艰辛的道路,过程中也很容易失败。创业不容易,大家还是要且行且珍惜吧。