北美大数据企业Splunk、Palantir业务及产品分析
Wikibon 统计了 2013 年全球大数据领域收入排名 TOP 30 的公司,其中不仅包括 IBM、 HP 等传统综合 IT 企业,也包括 palantir、 inrix 等专注于特定领域数据分析的新兴企业,我们尝试对该 30 家公司进行归类分析,并探索各类别企业背后的一些共性的因素。
传统 IT 企业 。 以 IBM、 HP、 dell、 oracle 等企业为代表,该类企业具有完整的软、硬件产品线,并通过既有产品线、 hadoop 等开源计算框架的融合,迅速构建出综合性大数据解决方案。
传统互联网企业 。 以 google、 amazon 为代表, 本身具有雄厚的技术和资金支持,且数据源丰富,自身业务对大数据具有较强的需求。
传统咨询公司。 以埃森哲、 BCG 等传统咨询公司为代表,作为咨询业务的延伸,依赖于对行业的理解,面向企业输出大数据实施方案以及承担相应的数据分析职能等。
新兴大数据企业 。 以 palantir、 splunk 等为代表,依赖于融合的计算框架和强大的技术实力,并叠加对特定行业的深入理解, 提供相应的数据分析服务,典型的技术、行业认知驱动。
新兴大数据企业依靠技术、行业认知快速崛起
完成上述的分析后,我们再回到产业链本身,沿着数据源、基础软硬件设施、数据分析三个核心环节进行归纳总结。
数据源:单一的数据源业务难独立存在
在营收排名靠前的大数据相关企业中,我们并未发现单纯聚焦于数据源环节的企业,我们判断在现阶段,数据源环节仍和数据分析等环节实现紧密绑定,难以独立存在,在未来从事单纯数据源业务的企业可能逐步出现。从数据来源来看,以美国市场为例,目前已经形成了企业自有数据、商业数据、第三方数据等多种数据融合、互通的良好局面。
基础设施服务:云计算和大数据相互促进,基础软件市场空间有限
我们观察到,云计算产业的大规模发展为大数据产业的崛起奠定了扎实的底层基础,同时市场对大数据产业价值的认可,也进一步推动云计算产业的规模化部署,两者互为促进。在基础软件业务部分,传统的数据分析软件和基于 Hadoop、 Nosql 的开源生态互为补充,开源软件部分,目前来看, Hadoop、 Nosql 商业化产品市场整体空间有限,且发展缓慢,且商业变现周期漫长。以从事 Hadoop 商业化产品开发的 Hortonworks 为例, 该公司自上市以来营收增长乏力, 股价持续下挫。
数据分析:新兴大数据企业的孵化池
作为上层应用环节, 数据分析市场占比在整体大数据产业中无疑是最大的, 其在产业中占比同时也客观上反映了产业的发展成熟度, 这里聚集了大量的新兴大数据公司,比如知名的 Palantir、 Splunk 等,我们分析发现该类成功新兴企业典型的特征可以简单概况为:突出的技术、行业深度理解。同时,从目前主要大数据分析企业所服务的行业来看,政府、金融、电信、医疗、 IT 等行业仍是主要的应用领域。
案例 1: Splunk
公司概述。 公司成立 2003 年,从机器日志分析产品起步,经历近 10 年的发展,逐渐成为机器日志处理、分析领域的全球领先企业,并通过持续的并购和外部合作,不断拓展自身技术边界,围绕机器日志分析丰富产品组合。
公司业务:围绕基础日志分析产品构建数据分析平台:
产品结构 。 公司业务功能主要分为五大块: IT 运营、应用管理、安全合规、网络智能与商业分析。 作为平台型公司,公司依托 splunk 基础产品,不断挖掘用户使用场景, 根据公司对客户的调研发现, 老客户的服务购买量是三年前的四倍,公司70%的收入来自于老客户的贡献。
商业模式 : 软件 license+运维服务。 Splunk 软件平台可以实时对任何 APP、服务器或网络设备的机器数据进行索引、监控与分析,并将结果生成图形化报表,在此基础上帮助客户避免服务性能降低或中断。 在此基础上, Splunk 逐渐形成软件许可证售卖和运维服务两种主要业务模式。
公司成功经验小结:
出众的机器日志分析产品。 Splunk 通用引擎能够将任何的机器数据广泛地索引,并支持任何格式的数据,而无需进行格式转换。同时在计算架构上, 其自主开发了类似于 MapReduce 的分布式架构,能够轻松扩展到支持每天新增上百 TB 的数据,配合基于角色的数据访问控制,还能跨多数据中心运行。
基于基础产品的数据分析平台构建。 公司围绕基础的 splunk 机器日志分析产品,不断挖掘客户的商业应用场景,并持续丰富产品组合,应用场景从机器性能分析到用户行为分析等,使得单位企业用户的价值挖掘和客户粘性均保持较高水平。
案例 2: Palantir
公司简介。 公司成立于 2003 年,创始人为 Peter Thiel, Alex Karp, Joe Lonsdale,Stephen Cohen 和 Nathan Gettings,其中 Peter Thiel 为原 paypal 创始人,硅谷著名投资人,后面三位均为硅谷顶尖程序员。发展初期主要面向政府机构提供数据分析服务,后借助政府订单背书,逐步将业务扩展至民用领域。
公司业务:
业务模式 。 整合海量的数据源形成全方位的可视化的输出,运用公司设计的相应算法进行联想、定位、分析的形式来分析单一个体或特定场景,提供解决方案。
产品组合 。 公司主要有两款产品, Palantir Gotham 和 Palantir Metropolis。它们都具有开放性、可延展性和可规模性,可以数周甚至数天内完成部署、发挥作用,可以快速迭代以反映用户反馈。
公司运营数据表现:
收入表现。 从 2011 年至今,公司年收入增长率维持在 50%-80%之间。
业务结构。 公司以政府客户订单起家,从 2010 年起公司业务在商业领域取得重大突破,目前已经有 70%以上的业务来源于非政府客户。
客户粘性。 一家企业成为公司的客户后, 1 年内的平均消费额是初始消费金额的 1.8倍, 2 年内的平均消费额是初始消费金额的 4.4 倍, 3 年内的平均消费额是初始消费金额的 7.2 倍,良好的客户粘性成为公司业务维持高速增长的重要动力。
成功经验总结:
借助政府领域背书,向民用领域积极拓展 。 Palantir 在成立之初,主要面向政府部门提供数据服务,在 2010 年以前,其没有任何的非政府订单,但是借助政府领域订单的背书,从 2011 年开始,公司先后获得摩根士丹利等大型金融机构的订单,到 2015 年,公司民用领域的订单额占整体订单收入比已经超过 70%。
技术和专业人才的有机结合。 Palantir 创立之初,已经具有社会威望的四位创立者和原 PayPal 技术人员就组成了强大的技术团队,并且依靠在 PayPal 时积累的反洗钱、反欺诈技术进入了政府大数据市场,以技术为导向的工程师文化是企业的核心文化,公司人员结构中,目前 75%以上为技术人员。 Palantir 认为分析工具固然重要,但是人的判断也是非常重要,最后机器不能做高级决策,需要人的参与;Palantir 平台奠定了基础,该平台把人工算法和强大的引擎(可以同时扫描多个数据库) 整合到了几近完美的境界。
注重信息安全和隐私保护。 Palantir 坚持认为,在数据无所不在的时代,严格的隐私和数据保护尤为必要。在其为政府部门提供的产品服务中,自动带有 Audit trail,以在需要时呈现政府用户对哪些公民信息进行过窥探。
据 Wikibon 数据,全球大数据市场规模在 2015 年突破 400 亿美元,产业发展初具规模,同时全球市场发展具有如下典型特征:
( 1 )形成多层次、 融合的大数据来源,包括企业内数据、商业数据以及独立第三方机构数据源。
( 2)基础软件模块整体空间有限,市场收入主体主要由数据分析服务和基础硬件模块构成,开源工具引入使得软件模块整体空间非常有限。
( 3)技术、行业认知驱动新兴数据分析企业崛起,以 palantir、 splunk 为代表的企业依托突出的技术,以及对特定行业的深刻认知,迅速打破传统 IT 企业的壁垒,并在特定细分行业领域占据主导地位。
节选自中信证券2016年5月6日发布的报告《 DT 时代真正驾临》。
End.