区块链与大数据!
这是每一个搞区块链的人都经常被问到的问题。但实际上这显然至少是三个问题:
一、什么是区块链?
二、什么大数据?
三、最后才是区块链与大数据的异同?
我们一直以来对区块链的定义都是:区块链实际上是围绕交易平等来设计的一套信用(信任)建设体系和价值流通平台。在这套体系和平台里,所有参与方地位都应尽可能平等(现实场景根据现实情况各有各的妥协);价值(token)随着交易同步流通。数据安全和隐私保护是区块链采用共识机制、分布式账本、加密技术、智能合约和授权模式等手段后的必然技术结果。 需要补充的是:这里提的交易泛指广义的交易,既包括我们对现有对交易的理解和认知,还包括任何价值信息的传递。
从上面的定义很容易看出来,区块链是多种现有技术的集大成,虽然没有创新型技术发明,但区块链最重要的是设计思想和逻辑,它是一套体系,一套以技术为基础,可以用Token进行生态设计和构建的生产关系。
我们经常听到有人说区块链是数据库,显然这种说法过于简单的把区块链等同于分布式账本了,严格来说是非常片面的!所以特别强调两点:
1、区块链是一套体系,数据库或者说分布式账本只是区块链体系内的一分子;
2、区块链的分布式存储是属于数据库的范畴,但和传统的数据库有本质的区别。这点下文会有说明。
再来说说什么是大数据。对于“大数据”(Big data)研究机构Gartner给出了定义,“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
这就是我们整天挂在嘴上说的“大数据”的定义,显然还是太啰嗦!套用诺贝尔奖得主ThomasJ. Sargent的说法,简单一句话,大数据其实就是统计学。同样运用了数据库技术、分布式存储技术、数据统计和数据挖掘技术。
到这里我们基本搞清楚了什么是区块链和什么是大数据的定义。也就可以说说区块链与大数据这点事儿了。
显然,无论是区块链还是大数据都用到了分布式存储,听起来好像一样,但内涵和玩法的差异是巨大的!
1、区块链利用了共识算法、中心不明显,甚至是完全去中心的,也就没有管理员的角色;大数据还是中心化的,管理员的角色回避不了,而且管理员有着完全的权限,带来的安全和泄露危险很多时候控制起来比较困难,公信力和区块链项目无法比拟。
2、区块链主要是围绕交易而设计的生态平台,因而区块链项目可以借助Token来完善整个生态建设和信用建设,一个好的区块链项目是有利于生态发展,并能最大化程度回馈所有参与方;大数据这种中心化平台本身并不具备生态和激励措施,如果有这块设计的需求是要从头开发的。
3、区块链自带加密算法,大数据有这方面的需求需要从头开发。
4、大数据没有区块链智能合约这一概念。
5、最重要的一点,区块链所用的数据库结构和大数据的数据库结构有着本质的区别,我们来看看区块链的区块展示:
上图一目了然的展示了区块,它所有的指向都是向前,传统的大数据刚好相反,向后向后再向后。
上面只是简单的比较和介绍,实际上区块链和大数据也真不是一回事,要说的也可以说很多。在各种场合的交流中,我还发现一个误区,很多人把大数据等同于数据库,所以很容易造成区块链、大数据和数据库的混淆。
上面介绍了这么多并不表示区块链和大数据就是冲突的。我一直强调,区块链产品重在设计,这种泛中心化的设计思想在区块链产品设计中主要体现在共识算法和智能合约实现上,其他该怎么设计就怎么设计,所以两者是可以共存的。
某种程度上来说,区块链技术的引入可以解决传统大数据和数据库很多固有的弊端,特别是基于区块链的数字身份和数据空间的引入,不仅可以改善传统数据库和大数据在安全与风险方面存在的问题,甚至还可以引入新的业务模式“对象既业务”改善大数据和数据库的运行效率。以“智信禅城”项目为例,引入区块链前后比较:
AD: 【移动新媒体】 科技茶馆-中国领先的区块链行业媒体互动平台