同济大学马万经教授:如何利用轨迹数据来解决交通问题
11月9日,由科技部高新技术发展及产业化司、科技部高技术研究发展中心指导,中国智能交通协会主办的2018’第十三届中国智能交通年会“交通组织优化与控制技术”论坛上, 同济大学交通学院副院长马万经教授 发表 《基于轨迹数据的交通 信号优化 》 的主旨演讲,本文为演讲录音整理,未经本人审核。
马万经:尊敬的各位领导、各位同仁,大家下午好!非常高兴每年都有机会和一些老朋友、新朋友介绍我们一年来所做的工作,我的报告内容分为三个部分。
一、背景概况
现在城市交通智能化发展非常迅速,迅速到我们可能来不及反应就已经出现了很多新技术,新的概念。我们到底需要什么,是值得思考的问题。
我曾经问过一个企业,你们有没有什么需要打磨的技术,他说没有。现在很多人都在琢磨有没有一个技术需要我们去思考、去打磨。我们发现有的系统因为采用了新技术变得更高效,而有的系统却是相反的。比如,更智能化的算法可能需要更多的数据,采集更多数据需要更多的线圈或传感器,这些都没有问题,但是投入这么多去维护的系统,是否可以发挥更大的作用。又比如,为什么有些国家和地区,不用那么复杂的系统,也不需要额外做那么多工作,他们的系统运行效果却这么好,因为方案和实际需求相匹配,这是要思考的问题。 未来的数据量可能会越来越多,传统的数据是轨迹数据,即便是汽车电子标识的数据,也是精度更高的轨迹数据,轨迹数据一直存在现实生活中,不需要另外的组装。如何利用轨迹数据来解决交通问题,才是我们需要思考的问题。
二、基于轨迹数据的探索工作
我们针对轨迹数据做了很多研究工作。比如对特征参数的分析,包括制作到达分布图和绿灯利用率的分析等等。
到达分布的分析 ,有一个非常重要的点,就是怎么去估计车辆从上游到下游的状态,我们是根据轨迹数据分析出来下游到达情况。这是两个周期的到达分布图,一个周期看上去不错,另一个周期看上去很差,这也许是随机现象,但按照逻辑来说,每个周期的图示结果都不一样,因此选择累计相邻的周期会对结果有很重要的帮助。
绿灯利用率 是很多专家经常利用的一个重要参数。但如果仅有样本率非常低的数据来做研究,也是非常有意思的情况。这是来自不同周期、不同天数形成的图示,反映的是相似内容。我们怎么利用这些数据,去计算出绿灯利用率的数值。绿灯到达率特征参数很多人都研究过,如何利用有限的样本去研究出车辆的轨迹数据。从这个图我们可以看到现有的绿灯到达率,我们常说的绿灯到达得多和红灯到达得少,或者反过来红灯到达得多和绿灯到达得少,这并不能说明什么问题,我们唯一要考虑的是要如何算出这个数值来。到达率合不合适,或者到底到达什么程度要如何去评判。如果去调整信号灯,绿灯到达率会不会因此而提升,如果因此而提升,那么这个调整是可以使用的,如果没有提升,那么绿灯到达率数值即使很小也是一种比较好的情况。
车队离散性参数 的计算很简单,如果车队的离散性很大,按照传统意义来讲,肯定不能做信号协调。车辆的离散程度是什么样的,可以做一些分析来获得结果。我们经常说,如果做协调控制的判定,周期、距离、流量都非常重要。周期先不说了,流量大的路口一定要做协调,流量小的路口可以不做。假如只有一条流量很小但要等很多红灯的路,老百姓更希望通过协调控制来缓解拥堵问题。
从轨迹数据去分析,如果数据很小依然覆盖大量车辆,即便是小的数据依然带来了有效的绿波,这取决于我们的协调到底能带来多大比例的效益。
三、交通信号数据的优化
做信号配时,用比例数据制定一定的定时方案,能否划分时段,像刚才深圳的交警说会做三个甚至更多时段的配时方案,我们要考虑轨迹数据是不是也能划分时段,毕竟在很多的地方,没有那么多线圈,没有那么多的检测数据,也许曾经有过,但是现在不一定有那么好的条件。
经典的分析做法是如果能知道流量大小,可以分成两个部分,只有轨迹数据的话很难去推测准确的数据。如果可以去推测轨迹数据排队和消散的情况,也可以去界定排队和消散的情况,与另外一种可以被分成两类,直接基于数据去分析,把一天分成若干个时段,可以针对每个时段去做相应的分析。
我们做的仿真分析还没有实际应用,随着实际数据的样本量增加,图上黑色的部分多表示全部划分的结果和真实的情况是一致的,你们可以看到数据的增加,不管量大还是小,或者说采集样本间隔的高还是低,都是比较好接受的程度。这可能是我们可以去做的第一个工作,还有很多的技术成份,比如说排列的图示。
我们还可以继续去做单点或者是干线的优化模型,有了轨迹数据之后,能够准确计算参数的同时,能够估计出变化的方案后,已有的轨迹以怎样的模式去调整。不同的流量情况下,原始方案的轨迹改变是不同的,我们可以去基于改变之后的轨迹计算出来新的方案,形成总体的指标进行评价,可以看到与已有的一些方案对比的情况。另外一个很重要的应用是去做干线协调方向,所有车辆的总停车次数的改善,这也是方案的一个优势方面。
轨迹数据是否可以代表全样本?我们做了一些分析后发现,在低样本的情况下,必须去重复使用很多很多的数据。但问题在于,很多城市特别是成长型的城市,交通变化非常地频繁,怎样才能够确保数据的准确性?不同采样间隔的数据处理与估计,不同车型数据的处理,不同驾驶行为是不一样的,也会表现出一些差异。轨迹数据与其他数据的融合处理,也是我们后续值得深入探讨的问题。
再次对国家自然科学基金委、上海市城乡建设和交通发展研究院、滴滴出行等机构表示感谢!