【CCCF专栏】2016年大数据发展趋势预测解读
作者:CCF大数据专家委员会
2015中国大数据技术大会(BDTC 2015)于12月10日在北京召开,会上CCF大数据专家委员会(以下简称“大专委”)发布了《中国大数据技术与产业发展白皮书(2015)》,并对2016年大数据发展趋势进行了预测。
CCF大专委自2012年10月成立以来,在每年12月举办的中国大数据技术大会上都会发布对第二年大数据发展趋势的预测,今年已经是第四次了。每次都是基于大专委专家委员的观点收集整理、投票、汇总、解读,最终形成年度预测,此预测是大专委集体智慧的结晶。在对2015年和2016年的两次预测中,还邀请了中关村大数据产业联盟的成员参加了投票和汇总,也部分反映了产业联盟的趋势判断。
在此次预测中,参加投票的大专委专家和产业联盟成员共116位。根据投票结果,汇总形成了下述预测。
2016年大数据发展十大趋势
1. 可视化推动大数据平民化
2. 多学科融合与数据科学的兴起
3. 大数据安全与隐私令人忧虑
4. 新热点融入大数据多样化处理模式
5. 大数据提升社会治理和民生领域应用
6. 《促进大数据发展行动纲要》驱动产业生态
7. 深度分析推动大数据智能应用
8. 数据权属与数据主权备受关注
9. 互联网、金融、健康保持热度,智慧城市、企业数据化、工业大数据是新增长点
10. 开源、测评、大赛催生良性人才与技术生态
1.可视化推动大数据平民化
“可视化”已连续三次入选大数据发展十大趋势,但今年能占据第一趋势,实在是意料之外。
最近几年,“大数据”概念深入人心。民众看到的大数据更多的是以可视化的方式体现的。可视化极大地拉近了大数据和普通民众的距离,即使对IT技术不了解的普通民众和非专业技术的常规决策者也能够很好地理解大数据及其分析的效果和价值,使得大数据可以从国计和民生两方面充分发挥其价值。
可视化是通过把复杂的数据转化为可以交互的图形,帮助用户更好地理解分析数据对象,发现、洞察内在规律。数据是人类对客观事物的抽象。人类对数据的理解和掌握是需要经过学习训练才能达到的。理解更为复杂的数据,必须越过更高的认知壁垒,才能对客观数据对象建立相应的心理图像,完成认知理解过程。好的可视化能够极大地降低认知壁垒,使复杂未知数据的交互探索变得可行。
可视化技术的进步和广泛应用对于大数据走向平民化的意义是双向的。一方面,可视化作为人和数据之间的界面,结合其他数据分析处理技术,为广大使用者提供了强大的理解、分析数据的能力。可视化使得大数据能够为更多人理解、使用,使得大数据的使用者从少数专家扩展到更广泛的民众。另一方面,可视化也为民众提供了方便的工具,可以主动分析处理和个人工作、生活、环境有关的数据。大约在10年前,可视化领域已经开始讨论为民众服务的可视化(visualization for mass)技术。在今天大数据的背景下,可视化将进一步推动大数据平民化。在这一过程中,急需更为方便、适合民众使用需要的可视化方法、工具。可视化也将进一步和个人使用的移动通讯设备(如手机)相结合。我们预测,在这一过程中,将有更多面向民众的大数据可视化公司涌现。
2.多学科融合与数据科学的兴起
大数据并不是简单的“大的数据”。在近年对大数据的阐述中,至少有两种典型的提法:一种是点出“小数据”的重要性;另一种是去掉“大”字而强调“数据”本身,强调数据科学、数据技术、数据治理、数据产业等。
大数据技术是多学科多技术领域的融合,涉及数学、统计学、计算机类技术、管理类等;大数据应用更是与多领域交叉融合。这种交叉融合催生了专门的基础性学科——“数据学科”。基础性学科的夯实,使学科的交叉融合更趋完美。
在大数据领域,许多相关学科研究的方向表面上看来大不相同,但是从数据的视角来看,其实是相通的。随着社会数字化程度的逐步加深,越来越多的学科在数据层面趋于一致,可以采用相似的思想进行统一的研究。从事大数据研究的不仅仅是计算机领域的科学家,也包括数学等方面的科学家。
很多数据相关的专门实验室、专项研究院所相继出现,《数据学》等著作也纷纷出版。大家认为数据科学的雏形已经出现了。
3.大数据安全与隐私令人忧虑
每次大数据发展趋势预测,安全和隐私都会出现在十大趋势中。这一条代表了人们对于大数据所带来问题的深刻忧虑。
第一,大数据的安全问题,十分严峻。这里指当大数据技术、系统和应用聚集了大量有价值的信息的时候,必将成为被攻击的目标。虽然影响巨大的针对大数据的攻击还没有见诸报端,但是可以预见,这样的攻击必将出现。
第二,大数据的过度滥用所带来的问题和副作用,最典型的就是个人隐私泄露。在传统采集分析模式下,很多隐私在大数据分析能力下变成了“裸奔”。类似的问题还包括,大数据分析能力带来的商业秘密泄露和国家机密泄露。
第三,心理和意识上的安全问题,包括两个极端,一是忽视安全问题的盲目乐观,另一个是过度担忧所带来的对大数据应用发展的掣肘。比如,大数据分析对隐私保护的副作用,促使我们必须对隐私保护的接受程度有一个新的认识和调整。
大数据受到的威胁、大数据的过度滥用所带来的副作用、对大数据的极端心理,都会阻碍和破坏大数据的发展。
4.新热点融入大数据多样化处理模式
大数据的处理模式依然多样化。大数据处理模式不断丰富,新旧手段不断融合,比如,流数据、内存计算成为新热点。内存计算继续成为提高大数据处理性能的主要手段。以Spark为代表的内存计算逐步走向商用,并与Hadoop融合共存。与传统的硬盘处理方式相比,内存计算技术在性能上有了数量级的提升。批处理计算、流计算、交互查询计算、图计算等多种计算框架使数据使用效率大大提高。
很多新的技术热点持续地融入大数据的多样化模式中,目前还没有一个统一的模式。从2015年中国大数据技术大会的众多技术论坛的安排,也可以看出这样的态势。技术各有千秋,将形成一个更加多样平衡的发展路径,满足大数据的多样化需求。这样的态势还会持续下去。
5.大数据提升社会治理和民生领域应用
基于大数据的社会治理成为业界关注的热点,涉及智慧城市、应急、税收、反恐、农业等多个民生领域。
在最易获得大数据应用成果的互联网环境之后,大数据走进国计民生成为必然。2016年,与民生有关的应用将成为热点。涉及民生的国计将是快速发展的热点中的热点,比如反恐、医疗健康等。
6.《促进大数据发展行动纲要》驱动产业生态
国务院在2015年8月31日印发了《促进大数据发展行动纲要》。纲要明确指出了大数据的重要意义。大数据已成为推动经济转型发展的新动力、重塑国家竞争优势的新机遇、提升政府治理能力的新途径。纲要还清晰地提出了大数据发展的主要任务,如加快政府数据开放共享,推动资源整合,提升治理能力;推动产业创新发展,培育新兴业态,助力经济转型;强化安全保障,提高管理水平,促进健康发展。纲要还提出了组织、法规、市场、标准、财政、人才、国际交流等方面的政策机制要求。
纲要将对大数据的发展起到重大推动作用,成为一个产业快速发展的催化剂和政策标杆。而各个地方政府一定会出台类似的配套政策。在中央和地方的政策推动下,政府的大数据专项扶植政策以及一些相关政策(如“大众创业、万众创新”的“双创政策”)会集中出台。
政府牵引产业生态,带动数据共享交换,政府带动的数据共享将成为数据流转的源动力,数据开放共享、交换交易成为产业生态的新态势。政策让数据流转动起来。
国有和民间资本的集中注入,大数据相关基础设施建设的采购和投入,政策和市场双重发力,让资金流转动起来。
政府牵引的产业生态发展成为大数据发展历程在2016年的突出特点。
7.深度分析推动大数据智能应用
在学术技术方面,我们认为深度分析会继续推动整个大数据智能的应用。这里谈到的智能强调涉及到人的相关能力的延伸,比如决策预测、精准推介等,涉及到人的思维和反射的延展,人的能力(智能和本能)的延展,这些都会成为大数据分析、机器学习、深度学习等学术技术发展的方向。
8.数据权属与数据主权备受关注
数据权属与数据主权被高度关注。大数据问题从个人和一般机构层面来看是数据权属问题、从国家层面来看是数据主权问题。
大数据凸显了数据的巨大价值。而数据的权属问题并不是传统的财产权、知识产权等可以涵盖的。数据成为国家间争夺的资源,数据主权成为网络空间主权的重要形态。
数据成为重要的战略资源。人口红利、地大物博、经济实力、文化优势等都纷纷体现为数据资源储备和数据服务影响力。
而数据资源化、价值化是数据权属问题和数据主权问题的根源。
9.互联网、金融、健康保持热度,智慧城市、企业数据化、工业大数据是新增长点
我国大数据应用领域最早获得成果的是互联网应用,如电商。而持续受到高度关注的还有金融和健康领域。互联网、金融、健康可以称为大数据应用领域的“老三样”。而智慧城市、企业数据化、工业大数据则成为新的增长点。这“新三样”其实就是城市、企业、工业的数据化,或者说是城市生活、企业贸易和管理、工业生产过程的数据化和大数据应用。“新三样”是一种更广泛的、覆盖更全的应用领域。
“最令人瞩目的应用领域”和“将取得应用和技术突破的数据类型”这两项调研投票的结果,印证了对“老三样”和“新三样”的判断。
10.开源、测评、大赛催生良性人才与技术生态
大数据是应用驱动,技术发力。技术与应用一样至关重要。决定技术的是人才及其技术生产方式。
开源系统将成为大数据领域的主流技术和系统选择。以Hadoop为代表的开源技术拉开了大数据技术的序幕,大数据应用的发展又促进了开源技术的进一步发展。开源技术的发展降低了数据处理的成本,引领了大数据生态系统的蓬勃发展,同时也给传统数据库厂商带来了挑战。
对数据处理的能力、性能等进行测试、评估、标杆比对的第三方形态出现并逐步成为热点。相对公正的技术评价有利于优秀技术占领市场,驱动优秀技术的研发生态。
各类创业创新大赛纷纷举办,大赛为人才的培养和选拔提供了新模式,完善了人才生态。
技术生态是一个复杂环境。在2016年,技术开源会一如既往占据主流,而测评和大赛将有突破性进展。
单项调研
大数据的最佳拍档概念是互联网+、云计算、智慧城市
不可否认大数据本身具有很强的概念性,我们也不否认大数据存在泡沫(甚至有炒作成分)。但是不能因为啤酒上面有泡沫,就放弃底下香浓的啤酒。大专委针对时下流行的重大概念进行调研(单选项),在众多流行的概念中,专家们认为和大数据最匹配的概念是“互联网+、云计算和智慧城市”,而其他选项则具有数量级的落差。
从最主要推动者的单项调研的变化可以看出,大型互联网公司的惯性优势、2016年以纲要为代表的政策性支持、双创政策对于创业激情的拉动,将是大数据发展的主要推动力。而科研和公共服务的影响则相对弱化了。
在大专委发布的《中国大数据技术与产业发展白皮书(2015)》中,重点阐述了大数据开放共享的问题。2015年的趋势调研也专门设立了这样一项调研:2016年,100多位专家及其工作机构对数据的态度是什么?对数据流转的态度是什么?调研的结果是,大家都想自己收集数据,希望能够利用收集到的数据进行数据服务,还希望能够买到数据集。而准备卖数据集的机构非常少。在整个数据流转上是需求大于供给,数据奇货可居。整个数据流转的态势不容乐观。希望通过政府开放共享数据,推动数据交流和交换。
图中的曲线对应大数据发展的六个阶段。方块柱表示相应阶段的投票人比例。
大专委的专家对当前中国大数据所处的阶段进行单项选择。从2015年和2016年的比例可以看出,专家们持明显的乐观态度,预测上升的人达到了九成。而预测下降的屈指可数。
选择2016年大数据处于“极为初级”和“即将快速扩张”两个阶段的专家超过70%,也就是认为大数据的峰顶还远没有到来,是极为乐观的发展预期。在政策、市场、技术的多重推动下,大数据将有非常美好的前景。
上述是对CCF大数据专家委员会专家们观点的统计结果和解读分析,难以涵盖专家们的独特观点和黑天鹅判断。但是这样的群体性预测,仍具有很高的参考价值。
(整理:程学旗、潘柱廷、靳小龙、袁晓如等)
via:新浪微博
End.