刘志刚:智慧城市理论与大数据应用实践
本讲座选自清华大学数据科学研究院智库的专家、中国智慧城市专家委员会的首席科学家、北京大学数字地球工作室的研究员刘志刚于2016年4月22日在“大数据在清华—数据科学高峰论坛”上《智慧城市理论与大数据应用实践》的演讲。
刘志刚 :各位嘉宾,大家好!在我的经历中,有三段和清华大学交往的记录,我曾经是美国Digital world公司的副总裁,第一段交往是1992年代表美国公司向清华大学引入先进的设备,第二段交往是2000年,我将即将成为国际标准的BACnet楼宇自动控制通讯协议引入中国,这个标准是国际上第一次将楼宇中的控制行为扩展到了网络上,ASHRAE花了八年制订这个标准,1987年开始制订,1995年正式发布,后来成为了ISO/TC205国际标准,我将该标准引入到中国,并组织翻译为中文版,通过国家质量监督局代表中国提出了两条修改意见后,成为该国际标准的支持国。同时找到了清华大学自动化系副主任王桂增老师,校长批准我们成立了一个联合实验室。第三次交往就是这一次,这一次是清华大学数据科学研究院韩院长邀请,我们共同探讨大数据、 智慧城市 的话题,我认为当前这个话题非常非常有意义。
今天想跟大家一起分享我自己对于“智慧城市”——2009年以前学术界称为“数字城市”——的研究。我是从2000年就开始研究数字城市,2003年在测绘遥感信息工程国家重点实验室,我针对数字城市建立了一个全方位的轮廓。2005年,进入北大数字中国研究院,担任产业研究中心首席研究员,继续进行深入研究,2007年后,我陆续发表了三篇论文,下面我将与大家分享有关智慧城市与大数据方面的理论心得与实践案例,我希望用一点点哲学角度谈论这个题目。
首先我们说中国为什么需要智慧城市,刚才大家也谈到很多,到底如何理解智慧城市?我为此专门访问过美国十所著名大学,看他们到底将这个前沿技术做到什么样?哈佛、耶鲁、斯坦福、普林斯顿、哥伦比亚大学我全都去过,实际上他们比中国来得慢,也就是说没有那么热。仔细思考,可以发现智慧城市对于非常发达的一个西方城市建设来讲,仅仅是锦上添花,而对我们中国,仅仅花了30多年时间,快速地建立的新兴现代化城市,那就是雪中送炭。因为我们的城市管理人才跟不上、管理制度不健全、管理经验不足。因此,我们才出现那么一些建设在先、管理滞后的现状。因此我们非常希望有一个技管的方法能够快速补充人管的缺陷,这是我们大家共同对智慧城市特别热烈的一个主要原因。
现在中国迅速崛起的各个城市,都盼望着我们的城市管理迅速得到加强。当前,社会矛盾很多,城市管理水平尚在初级阶段,我们是否应该更多地采用技管的方案呢?这就是Why Internet+,其实就是为什么推行智慧城市?经历了这么多年,我们可以看到一个现象,这个现象是什么现象?引领人类发展的诸多理论受到了现实极大的挑战。资本论的挑战存不存在?爱因斯坦、牛顿的理论存不存在挑战?我们可以思考一个很重要的时间点,这个时间点就是2008年,2008年以前我们地球的资源尚可以覆盖人类的欲望,但是2008年以后显然覆盖不了了。有人就会问为什么你一定说2008年?为什么不是2007年?为什么不是2009年,我们说人类欲望的总和来自于两个自变量的乘积,一个是人口基数,一个是欲望数。人口基数我们已经达到近70亿,在二战以后我们基本上没有大幅度递减,一直在递增。
人口基数真正大规模递减有三个因素,一个是灾难、一个是瘟疫,一个是战争。人类克服了这三个影响了以后,我们人口基数上升得很厉害。西方工业文明的发达,引领了人类对物质和能量的极大消费,特别是咱们中国,更换手机、电视机、空调的频率无以复加,我们更换高档消费品的频率比美国还要高。显然,二元乘积关系就是指数关系,指数关系就一定有个拐点,这个拐点就是2008年,2008年以前我们对能源供给有那么紧张吗?没有!2004年,我们整个人类消耗的石油是220万亿桶,而今我们的需求已经大幅增长,这个增速确实很可怕。
曾经支持人类发展的一系列经典理论,现在我们需要反思,真理从来不在蒙着灰尘的圣人书本上,而在浩瀚的大自然及宇宙空间中。人类从细胞进化到现在,是宇宙大自然孕育了人类。当我们解决智慧城市的问题,当你找不到答案的时候,我建议大家去找大自然。我曾经自己尝试过给军队做一个案例的时候,我就尝试向大自然找到了解决问题的钥匙。
我们知道,产品是技术的载体,而应用则是数据的载体,现在技术发展相当迅速,并发展到极致,但是我们的许多应用问题仍然没有解决,例如:交通、教育、能源、健康、等等,因为我们过于强调发展先进的工具,而忽略发展解决应用问题的方法,这才是我们真正需要建立的思维。智慧城市是一个应用巨系统,显然也是一个 大数据 系统。刚开始提数字城市的时候,大数据问题已经扑面而来,我们实际上做了没有?做了,但是没有提到一个很高的思维去考虑这个问题。实际上,大数据本身只是个标签,数据科学才是真正的理解。
西方一直是重视器件性的研究,而东方的我们恰恰是重视事件性的研究,这两者区别在哪里?西方的器件性研究就是工业文明的一个延续,工业革命总结了三大精细化经典武器,我们现在应用掌握得非常好,一个是标准,一个是模型,一个是工具。而东方的农耕文化则留给我们天、地、人的生态化系统思维。
人类发展经历了三个时代,我们说发展消费信息才能够满足人类不断膨胀的欲望,因为制造信息也是爆炸性的。我们现在面临的周边设备那么多,物联网因此而非常重要,但是 物联网 不仅仅是物物相连,重要的是生命相连,运行相连。物联网的出现带来了互联网时代的春天,感知与控制完善了 人工智能 的行为模式。到底什么才是我们所说的智慧的信息时代。
智慧城市描述不能脱离实体城市,2009年以前不叫智慧城市,2007年我在北大发表的了数字城市应用模型,实体城市和数字城市之间,可以视为是一个虚拟对照。一座城市的建设,初始即五通一平,继而再有建筑,然后才有生活,所以我们的智慧城市也一样,基础层的“五通一平”就是广域网及物联网,“建筑”就是我们的平台,人文层的生活就是我们的智慧化的应用及生活。
2009年兴起的物联网概念,就是我在2007年在北大发表的异构网概念,而异构网较物联网定义更为广泛,异构网将生命相连、运行相连、对象相连均包含其中。我在2003年提出ICT概念,当时我在测绘遥感信息工程国家重点实验室,这里的T与西方提出的ICT中的T是有区别的,我定义的T是Terminal,指的是末端设备,即传感器、执行器、控制器、视频音频设备、等等。而ICT这三个节点正好是我们所有信息传输全过程的三个重要节点。
关于智慧产业,我们说智慧城市没有智慧产业的支撑那不行,城市必须有造血功能,否则就是一座空城。智慧产业就是我根据ICT概念设计的,ICT分别是理论模型、技术模型、产品模型,而应用模型则是基于位置的应用,形成四大模块,四大模块里边第一个模块就是研究数据问题。第二个模块就是研究我们的技术问题,第三个模块就是研究末端设备问题。第四个就是我们的应用解决方案,这就是我在2007年发表论文内容,现在仍然非常实用,我自己依据这个论文观点设计了许多智慧应用项目,并完成了建设及运营,特别在大数据建模、数据对象仿真、等等应用问题中。对于ICT中每一个模型的内容,均融入许多创新思想,例如我在2005年发表的空间信息分布论。空间信息如何分布?对象数据模型如何来构建?当我们现在发展大数据的时候,一定要记住,不是有数据而去做应用,而是先有你的对象再做事情。而对象是什么?我们这个对象是一个广义对象,在这里可以描述这个对象,它有可能是单体的,人、建筑、汽车也可能是一个群体的,也可能是一个系统。这些对象只要你给它定义一个边界,它就是一个有生命的运行体,包括交通系统,它就是个生命体。这个生命体我们可以找到它三个具有共性特征的数据内容,第一是它的属性,第二它的表现,第三它的环境。环境就是围绕它、影响及制约它的数据,因此这三者之间就自然形成了这个对象的数据分类。这个数据分类就是我们采集的数据。我们将这三类数据用来建立这个对象的数据模型,用这个数据模型即可进行仿真预测。
这种数据模型才是我们现在用得最多最广泛的,而不是我们现在拥有多少数据,我们要开放多少数据。也许有的人在抱怨我们的数据缺少,数据量不够,样本量不够,我认为都不存在这个问题,如果我们将对象群体细分,则可以建设全新的虚拟对象标准模式。我们通常见到的标准是大一统标准,也是受工业时代的影响,常规情况下,我们建立一个标准全国发布,等你发布已经过时了。因此在智慧大数据时代,我们需要重新思考标准的意义及制订的方法,我设计制订的标准通常是一个对象细分的标准,它可以动态刷新,指导性很强,而且它是来源于样本量,又用回到样本。
在南方,我设计建设了四五个项目,包括刚才说的健康项目、交通项目、能源项目、教育项目,我其中有个交通项目是在测绘遥感信息工程国家重点实验室那里做的,那个项目作为申报内容的重要应用支撑,获得了国家科技进步二等奖,其它项目都非常具有创新意识。我举个例子,健康问题,大家做了很多健康项目,比如说今天遇到了某一个对象,我问韩院长,你身体怎么样?还行,如果两年以后再问韩院长你身体怎么样?还行,实际上不知道,随着他的年龄递增,他的身体状况是有所递减的,变化的微动自己不察觉,医院也不管,我的数据可以侦测到你的健康指数,那么以后我们再碰到那就不一样了,我问今天怎么样?我是76,明天呢?83,那就非常成功,这是2009年我在南方做的数字健康服务项目,并且首创设计了一个健康指数,分别设计了五大应用类型:强壮、健康、亚健康、虚弱、病态,每一个状态20个刻度。这是我在北大发表的数据共性模型内容之一,围绕对象的三维数据模型,即空间、时间和事件。基于这个模型,我们就有了采集的目标。
对于任何一个互联网项目,都符合一个共性数据模型,即覆盖所有的应用,因此用这个模型我们来实现任何一个项目的共性化。无论某个项目是什么?是快递也好,是教育也好,实际上有很多共性之处,共性部分几乎占了占了80%,而个性部分只有20%,因此我们在设计新的应用项目最多三个月就完成了,因为共性部分已经是积累,只是将个性部分对接一下就可以了。这就是说我们需要研究对共性的理解,并且将其不断升级,不断提升共性模型的完整性、准确性,这样我们就做得更漂亮。
这是我设计的电子政务服务系统信息模型,以及互联网+保险、互联网+消防模型、互联网+建筑节能、等等项目。
关于能源数据的采集、能源数据的仿真处理,大家知道,P=KW.h我们把节能问题的重点放在h上,不放在KW上,控制能耗设备的运行时间而达到节能目的。2003年设计的数字交通服务平台,我们可以在地理信息平台上画一个圈,任何人只要带着手机进去出来都会报警,而且多人进一圈,一人进多圈,并且还辅助进行公安围堵及追讨追踪。关于在达实智能公司设计的城市能源监测管理平台,当时我是达实智能博士后工作站的主任。
谢谢大家,很抱歉,由于时间的问题,没有完善表达我的内容,请大家谅解。
整理丨谷玲
校对丨曹香香 中国移动通信研究院。
二校丨张冬阳
注:本稿件摘自数据观入驻自媒体—数据派,转载请注明来源,微信搜索“数据观”获取更多大数据资讯。
责任编辑:陈卓阳