大数据底层软件工具化,产业链价值向数据源和应用跃迁
随着信息技术革命的迅速推进、多媒体技术的飞跃演进,世界正大概每两年翻一番前所未有的高速产生海量数据。根据预测,这个速度在 2020 年之前会继续保持下去。这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量,全球数据在 2020 年将达到 40ZB。在我国, 2010 年新存储的数据为250PB, 2012 年中国的数据存储量达到 364EB,约为日本的 60%,北美的 7%。高速产生的海量数据是发展大数据的动力,也为大数据行业发展提供了必要燃料。 如何有效的存储、处理、检索这些海量数据对传统的数据库软件提出了巨大的挑战,用非结构化数据替代结构化数据已经成为主流。 过去的 2015年被广泛认为是大数据应用启动年,百度提供的“大数据” 关键词热搜指数也表明大数据关注度在 2015 年一度达到顶峰。
随着大数据技术的成熟和应用的拓展,大数据技术开始创造与日俱增的社会财富并吸引更多关注和投资。据工信部发布的《中国大数据发展调查报告》称, 2014 年中国大数据市场规模约为 84 亿元, 主要由基于 Hadoop、 Spark 的大数据软件产值、用于承载大数据应用的硬件产值, 以及大数据相关的专业服务产值三部分构成,报告预计 2015 年中国大数据市场规模将达到 115.9 亿元,增速达 38%。未来随着大数据应用效果的逐步显现, 一些成功案例将产生示范效应, 预计 2016 至 2018 年中国大数据市场规模还将维持 40%左右的高增长。
“数据将取代石油,成为未来制造业最大的能源。 ” 马云一句话很形象的概括了数据即资源这一概念, 表明大数据将从互联网等前沿行业开始渗入近乎所有行业并产生深远影响,同时也正式宣告互联网时代正加速从 IT( InformationTechnology) 时代向 DT( Data Technology) 时代演进,大数据也成为了 DT 时代新的主旋律。
“云计算和大数据是一个硬币的两面,云计算是大数据的 IT基础,而大数据是云计算的一个杀手级应用。” ——张亚勤。
云计算是通过并行化和分布式计算技术实现业务质量可控的大数据处理能力 。 一方面, 云计算是大数据成长的驱动力,而另一方面,由于数据越来越多、越来越复杂、越来越实时,这就更加需要云计算去处理,所以二者之间构成相辅相成的关系。 Hadoop 以其低成本和高效率的特性赢得了市场的认可,已经成为云计算技术中的佼佼者。
Hadoop 集群软硬件的花费极低,每 GB 存储和计算的成本是其他企业级产品的百分之一甚至千分之一,性能却非常出 色。 Hadoop 设计之初的目标就定位于高可靠性、高可拓展性、高容错性和高效性, 因此 Hadoop 一出现就受到众多大公司的青睐,同时也引起了研究界的普遍关注。 Hadoop 1.0 版本于 2011 年 12月 27 日释出,标志着 Hadoop 已经初具生产规模。如同其他革命性生产工具的出现一样, Hadoop 正式版的出现也第一次引爆大数据产业发展。
大数据技术脱离炒作加速向生产力平台方向演进
2014 年, Gartner 对新兴技术发展周期预测的炒作周期曲线上,大数据已经开始由过期望最顶点加速滑向下调预期最低点,有望在 5~10 年内达到稳定的生产率。 另外,到在 2015 年的技术发展周期预测上面,已经没有大数据的身影,取而代之的是公民数据科学、微型数据中心、自我实现的高级分析与大数据直接相关的技术, 以及可判断人类意图的技术、物联网等与其间接相关的进步。大数据技术这一变化趋势,与发展较早的云计算轨迹类似。 我们认为,这一改变表明对大数据概念的炒作已进入尾声,企业将会更加关注数据应用,实时的数据分析能力 也正日益成为核心竞争力。
大数据脱离了炒作周期一方面表示大数据不再是行业关注重点,在一定程度上会减少业内对大数据行业的关注度和投资热情,另一方面也代表着大数据开始彻底由概念转向了技术落地并加速向生产力平台的方向发展。大数据在脱离了炒作期得以让业界冷静下来从而准确的认识并进一步接受和聚焦大数据所能产生的巨大潜在价值, 而不再是仅仅纠结于概念和预想, 大数据产业也将有机会轻装上阵加速通过谷底期。
大数据产业链价值正从底层设施加速向产业上下游流动
经过对整个大数据产业链的调研,我们认为大数据底层软件、数据强化产业以及相应的数据分析产业已经逐渐成型并加速走向成熟,大数据变现通道已经打通。 海量数据经过有效的分析处理从而可以支撑大数据应用,完成“数据→信息→知识→决策”的一整套数据到应用变现链条。“工欲善其事,必先利其器”,大数据挖掘、强化、分析这些中间 技术环节构成了整个大数据产业的必要工具, 因此从大数据问世至今一直都是整个产业的建设重点。 在大数据的淘金潮前期,大数据底层设施包括大数据软硬件以及数据分析等作为淘金工具必将领先产业链受益。正如淘金潮最终的价值在于黄金而不是在于铁锹的贩卖上,我们认为 工具的进化只是手段,最终的目的是整个产业的革命。
过去几年对大数据挖掘、强化、分析的投资与建设已经帮助大数据工具在 2015年基本成型,大数据工具走向成熟,开始能有效、及时、深入地处理、分析大数据源提供的海量数据,挖掘其中的价值从而支撑大数据应用。 从这个角度来看, 2015 年毋庸臵疑是大数据应用元年也是大数据走向落地的关键年。
随着大数据变现通道的打通, 我们认为大数据产业链价值正由数据分析工具加速向数据源以及数据应用两个具备可持续变现能力的方向流动。另外,大数据底层工具到大数据分析作为大数据工具层虽然已初具规模但是面对日益增加的数据分析需求依然处于初级阶段,其未来依然具有较大成长空间。随着大数据通道的拓宽,数据源本身所蕴含的巨大价值将得到更充分的挖掘。大数据应用将变现更多价值,同时应用潜力将得到进一步释放。同理, 数据工具的进化将可以有效处理更多的数据类型包括传统的结构化、非结构化以及半结构化数据。
受数据变现价值加速显现的影响, 数据源的战略地位将得到进一步巩固,同时更多样的数据源将得以挖掘。总之,大数据变现的通道将会随着大数据工具的继续发展而拓宽,数据将加速且更有效地从产业上游数据源向下游数据应用流动,更多的数据源和数据应用将会不断涌现,从而导致大数据产业价值由目前的数据管理分析以及相应工具向数据源和数据应用两级跃迁。
结论:
2015 年是大数据应用启动元年,虽然大数据产业链还没有迎来预期的爆发,但是我们调研中发现大数据产业链依然在高速成长,未来一到两年内实现大数据应用的全面爆发确定度较高。目前,大数据底层软件到数据分析技术发展已经趋于成熟,大数据生态逐渐形成,大数据产业变现通道已经打通。产业价值将加速向产业链两端即数据源和数据应用跃迁,大数据底层到数据分析将向着工具化、管道化发展,依然存在较大拓宽空间。
大数据产业向生产力平台方向演进,产业链价值从底层设施加速向产业上下游跃迁: 近几年大数据行业迎来了高速发展,大数据挖掘、强化、分析这些中间技术环节由于构成产业必要工具而一直是产业的发展重点,也已率先走向成熟并打通大数据变现通道。我们认为,随着大数据变现通道的打通以及后期拓宽,产业链价值正由数据分析工具加速向数据源以及数据应用两个具备巨大可持续变现的产业链上下游跃迁。目前,整个生态依然处于初级阶段, 继续解决行业痛点将助力产业加速发展也隐藏着大数据产业发展新机遇。
大数据底层软件和分析逐渐工具化/产业化,需求上升带来产业发展空间: 大数据底层工具以及分析处理市场随着分析需求数量和种类的增多而迎来更广阔的市场并催发新一轮技术创新。大数据分析作为大数据应用的必经之路, 由于数据源以及数据应用的不同存在两个主要发展方向: 1 、向普适化软件发展; 2、结合具体行业向咨询、管理工具发展。 我们认为, 大数据应用集中爆发将导致数据分析需求多样化和定制化,结合具体场景深入行业分析将更具优势。
应用层作为变现最终阶段将迎来加速发展,拥有数据源将在大数据生态形成后占据产业链制高点: 数据源到应用变现通道加速形成,大数据应用模式创新加速在精准营销、征信金融、影视娱乐、医疗健康等行业崭露头角,并开始从线上走向线下帮助传统行业如房产、汽车、零售等打造闭环生态。单纯以大数据技术为主业的业务创新模式开始抬头并迅速被各行业接受,如大数据安全、咨询等。随着大数据产业链条逐渐打通拓宽,成熟大数据生态形成后拥有关键数据源的企业将掌握数据链上游核心资源,将迎来数据直接变现带来的发展机遇。
节选自中银国际证券有限责任公司《 大数据产业发展深度报告——产业底层设施逐渐完善,大数据变现走上快车道》
End.