建设智慧城市领域的"ImageNet"

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

建设智慧城市领域的"ImageNet"

德国人文地理学家F.拉采尔曾指出“交通是城市形成的力”。而拥堵的交通环境,则能让一个城市“乏力”,处于亚健康的状态。

在人口密度大、城市集聚效应明显的亚洲和拉美地区,交通拥堵更是阻碍城市发展的“老大难”问题。

“交通是一个城市的尊严,数据挖出看不见的路”。2018年的云栖大会上,中国工程院院士王坚这样表示。

很多城市面临着亟待解决的交通问题,而数据是实现交通立体化管理的基础元素,然而目前城市交通数据普遍面临数据少、质量差、呈孤岛分布等问题,导致模型构建困难,阻碍了智慧城市的发展,这该如何“破题”?

智慧城市发展需要一个CityNet

“任何人工智能应用都需要大量真实数据进行训练,才能投入实际应用,像计算机视觉技术可以发展到今天这个地步,和有海量高质量真实数据的知名数据集ImageNet是有很大的关系的。”香港科技大学教授陈凯对雷锋网表示道。

建设智慧城市领域的"ImageNet"

陈凯教授

“但在智慧城市领域,目前还没有一个像ImageNet这样高质量的数据集,所以在我们项目计划中,我们要打造一个智慧城市领域的数据集,我给它起名叫‘CityNet’”

“具体来说,我们计划建设一个高性能的分布式AI云平台,叫图灵平台,首先我们会将香港的交通数据(交通署、运输署、天文台等机构的多模态数据),以隐私保护和数据脱敏的方式实时汇入图灵平台上的CityNet,然后利用图灵平台的算力,应用图神经网络、迁移学习、联邦学习等最新的人工智能技术,对城市交通流量、人流量实现精准的预测,从而提供精细的、动态化的城市交通管理。”

在提出建设CityNet这一数据集的背后,是陈凯教授对于智慧交通建设现状的清楚认识,他认为,目前智慧交通的建设存在两个问题:

  • 一是不同的数据源只能分开分析:现有研究工作多数只能同时对一种数据源进行分析,但不同类型的数据源之间存在关联,同时对多种数据进行分析可以提高预测系统的准确性和稳定性;

  • 二是不同城市的经验知识无法相互借鉴:每个城市使用自身数据构建系统模型,不能有效利用先进城市的知识帮助其他城市构建模型,在新城市部署交通流量预测系统要重新训练模型,成本较高。

陈凯说道:“大家都在追求新技术这个是好事,但就智慧交通来说,目前并没有一个顶层的架构设计,也会出现同类技术重复开发的现象,我们希望用技术手段推动数据和算法层面合作,避免机器学习模型的重复训练,这是我们要建设图灵平台和CityNet的初衷。”

“力”的作用是相互的。城市在为CityNet提供数据的同时,也可以应用CityNet中已有的模型,来建设智慧城市。

数据隐私和算力成最大挑战

透过陈凯教授的介绍,我们不难发现,CityNet数据库的建设,会为城市智慧化建设带来强有力的帮助。但CityNet数据库要汇聚诸多城市的数据,数据安全则是首要考虑的问题。

当前,欧洲、美国相继颁布了数据隐私保护法,很多科技巨头甚至因为数据安全问题被巨额罚款。

基于此,雷锋网 (公众号:雷锋网) 深入解了陈凯教授团队是如何应对智慧交通建设中的隐私安全问题。

在陈凯教授看来,隐私问题不仅仅是一个监管的问题,也是一个技术问题。“我们在把CityNet 数据库建设成最大的智慧城市数据库的规划中,数据隐私安全是很关键的一个研究课题。”

陈凯继续说道:“图灵平台会对CityNet 数据进行统一管理,应用联邦学习和加密计算等技术,以隐私保护的方式把 CityNet 数据提供给智慧城市的研究者使用,研究者在训练机器学习算法的时候,无需知道原始数据里的私有和敏感信息。”

联邦学习则可以让数据不动,模型动,通过联邦学习技术,可以让使用者不需要知道CityNet的原始数据是什么,但仍然能够学到知识。

除了针对数据隐私安全的理论研究之外,经过加密后的庞大数据对计算机算力的要求提高了十倍甚至更高,那么,这个时候,算力也成为了一个挑战,而这也是陈凯教授擅长的研究领域之一。



陈凯教授详细讲解《图的数据流深度学习范式》

据雷锋网了解,陈凯教授从事大规模数据中心的研究有十多年,在相关高水平国际会议和期刊发表学术论文的数量居亚洲第一,是系统和网络性能优化这一领域的带头人。

“我们的图灵平台是一个高性能分布式AI集群计算架构,通过高速通信技术RDMA,提高大型 GPU 集群吞吐量,降低通信延时,提升集群的整体计算效率,支撑大规模图式流数据上的深度学习和迁移学习。”陈凯教授解释道。

除此之外,陈凯教授还组织了一支集土木工程、信息科学、计算机科学等多个领域的专家团队来共同推进项目的研究。

“为了这个项目我们组成了一支比较综合的核心团队,由香港科技大学、香港理工大学、香港中文大学的8位教授组成,我们还将组织一支50人左右的团队,让我们的研究成果可以从科研到展示到实现项目的真正落地”

建设智慧城市领域的"ImageNet"

陈凯教授和实验室团队

谈起研究中更长远的目标,陈凯教授对雷锋网说道:“香港的交通比较复杂,如果我们可以将香港交通做好,其实对于其他城市的借鉴意义非常大。如果有成功的经验的话,我们会逐步延伸到粤港澳大湾区中另外一些交通网比较复杂的城市。”

智慧城市研究获资助

2017年,香港特区政府拟斥资7亿港元发展智慧城市建设,并公布了未来5年的香港智慧城市发展蓝图,其中涵盖6个方面,包括智慧出行、智慧生活、智慧环境、智慧市民、智慧政府以及智慧经济。

在此次采访的一个月前,陈凯教授提出的应用在智慧城市中的“高性能分布式基于图的流数据机器学习框架”,获得了2020/21年度香港政府高达3300万「主题研究计划」资助。

值得一提的是,「主题研究计划」自2011年设立至今,共计52位项目统筹负责人在列,80%以上为资深讲席教授,包括多位国内外科学院/工程院院士。而陈凯教授是香港「主题研究计划」有史以来最年轻的项目统筹负责人,

“我们的项目面向智慧城市蓝图中的三个场景:交通、健康和经济。首先落地在智慧交通场景上。”,陈凯对雷锋网解释道,“据相关数据显示,香港每一公里交通路段上面,有350辆车左右;香港每天乘坐公共交通可达1200万人次。我们希望通过人工智能算法提高公共交通的运输线路的效率,缩短人们上下班出行高峰的等待时间。”

此外,在陈凯教授团队的规划中,下一步还将整合城市交通、公共医疗、金融方面的真实的实时数据。基于这些数据,就会为商业选址、基础设施建设、商业广告投放等多个产业提供智能化的帮助。

经过陈凯教授的介绍,整个项目框架也逐渐清晰,雷锋网将其总结为:

  • 建设高质量的智慧城市数据集:通过隐私计算,数据脱敏的方式将香港以及国内外诸多城市的交通数据汇入到CityNet数据集中;

  • 搭建图灵平台:对CityNet中的数据进行处理、分析来搭建深度图神经网络模型;

  • 通过深度图神经网络模型、大数据分析与可视化工具,对城市运输提供精细的、动态化、自动化的城市交通管理,例如: 1)对城市交通流量、人流量实现精准的预测,辅助实现精准交通调控;2)实现智能预警系统,对预测车流量超出容量的区域作为潜在拥堵区域进行报警;3)分析预测城市出行需求与各路线与交通工具的预计到达时间(ETA),实现个性化的最佳出行建议与路线规划。

结语

基于在AI算力和数据安全领域的不断探索,2018年,陈凯教授创办了星云Clustar,持续在加速AI算力、提高集群计算效率、保护隐私安全等方面进行研究,致力于将联邦学习,同态加密,高性能AI集群技术等最新研究成果应用到金融业、制造业等其他领域。

相信在不久的将来,我们就会迎来陈凯教授团队的捷报。

在最后,我们也转达一下陈凯教授对其智慧城市研究项目的期望:这是一个非盈利的科研项目,我们希望可以有更多的人能了解图灵平台和CityNet,来做一些贡献,同时也会享受到CityNet带来的回报。

随意打赏

提交建议
微信扫一扫,分享给好友吧。