需要提炼的“金矿”|陈宁宁:这一年我们用过的大数据成果

公司新闻

大数据很重要,已成为交通行业的必需品,那么到底使用效果如何呢?

在“第二届(2018)中国交通信号控制发展年会-交通组织与控制”论坛上,广东振业优控科技股份有限公司CEO陈宁宁从一线用户的角度分享了这一年他们在信号优化工作中使用过的基于轨迹数据的大数据成果。

图1

以下为陈宁宁演讲全文,内容有删减。

在去年的行业年会上,我曾经讲,大数据、互联网+交通管理簇拥而至,兴奋过后会有很多无奈。

这些无奈包括:放大了数据的作用;夸大了对交通改善能够达到的效果;为了大数据而大数据;实际停留在数据展示层面;有本末倒置的情况。今年我们在无奈之后,进行了不少实战的探索。我觉得交通大数据是非常好的方向,不管是什么成果,能经得住实战检验就是好的成果。

这一年总体来说基于轨迹数据的大数据的成果可以分成两大类:方案参数类和趋势指标类。我认为应该区别对待,不要说所有都有用,也不要说所有都没用。

首先,我们经常会接到基于轨迹数据分析得到的建议配时方案,但是实用的感受是建议周期确实很不准,很不靠谱,平峰时间经常会出现过小的周期,高峰的时候容易出现大周期,这有比较明显的“韦伯斯特”的痕迹。

绿信比比较可用,因为对于每个方向流量比例的掌握,特别是通过轨迹数据出来的有一定参考性。

但是对于相位相序的自动优化,互联网企业都没有自动生成的功能,相位相序本身就是有很大难度的事情。

图2

平均行驶速度也是我们经常使用的一个参数。这个案例是一个中心城区的主干道,高峰时段车流繁忙,我们想使用基于轨迹大数据分析出来的平均行驶速度来设计绿波。

使用的感受是统计周期为30分钟的平均行驶速度反映不出道路的实际情况。根据这个平均行驶速度来做的协调控制基本没有实现绿波的效果。而且不同时间平均行驶速度的误差相差很大,越繁忙,平均行驶速度的可用性越差。

另外,在这个案例中提供给我们的数据,我估计是在计算平均行驶速度的时候没有去除停车等待时间,用路口间距离除以时间得到的速度就低了。

图3

如上图,这个案例也是使用平均行驶速度来计算绿波,是一个新开发区的几条主干道,某些主干道过境货车比例较大,某些干道饱和度较低,干扰较大。

使用的感受是:对于干扰较少的干道,平均行驶速度比较准确,效果不错,确实做出了很好的绿波效果;对于大货车较多的干道行驶速度确实不准确,误差非常大,感觉可能因为轨迹数据样本基本上都是小汽车。

为什么干扰较少的数比较准呢?我的感觉是去除了交叉口停车等待时间,然后算的速度相对会准一些。

图4

另外经常会需要用到排队长度参数,在刚才那个中心城区主干道的案例里面使用感受是排队长度不准确,变化趋势也不准确,我觉得可能还是轨迹数据样本量的问题,而且没有分析到几个路口会产生回溢现象,实际上我们观察到有回溢现象,但是在数据上面没有反应。

可能因为这个是通勤时段,上下班通勤时段的样本量不够。

图5

上图是使用排队长队的另一个案例。使用感受还是排队长度不够准确,但是排队和消散过程的动态趋势是对的。 这样的结果不宜用于计算方案,如果用这个排队长度去调整我的这个方案就不可行了,但是可以用于动态分析方案效果。

趋势指标类也有很多指数,使用感受是经常用于路口发生拥堵或者发生异常实时报警,然后及时发现突发拥堵,提高发现问题的效率。但是最大的问题是没有分转向,轨迹数据的分析在拥堵路口进口道没有分转向。

在趋势类指标中,更恶劣的就是城市拥堵指数排名。这个拥堵指数和选定的计算区域有很大关系,想要一个城市的拥堵指数下降,只需要把一个不拥堵的区域(比如说不繁忙的新开发区)加到计算区域里就可以了。

不同的城市之间没有可比性,用拥堵指数排名来比较哪个城市更拥堵,更是违背科学原理的。但不少城市却是被拥堵指数排名给绑架了。

图6

趋势指标类还有用于一些路径和OD分析,因为要截流,要知道车从哪来,到哪去,大概发生在什么时段。例如上图的案例,就是基于轨迹大数据分析从一个城区东西两边的通道进入城区的路径选择和 OD,包括过境的交通量和路径,以便做好不同时段的截流控制。

使用感受是这些来自互联网公司的基于轨迹大数据的分析成果填补了OD和路径方面的数据空缺,有比例和趋势。但是缺点是只有比例,没有具体流量值。但仍然可以用于下一步对截流和分流效果的对比。

图7

在做这个案例的同时,我们也分析了路口的各流向比例。这是一个路口上面关键节点用轨迹数据分析出来的结果,但是我们做了实测对比,其实各流向比例与实测对比还是有误差,但是这个误差非常不稳定,有19.5%,有10%,有23.4%。

关键问题不是分析结果有误差,而是各流向比例的误差波动太大,我们根本把握不了这些结果到底有多准。

 

使用感受小结

轨迹大数据成果有一定可用性,但是这个地方能用,不代表其他地方能用,这个时段能用,不代表其他时段能用。所以我认为轨迹数据及其分析结果在时空上的“个性”很强。

我们在使用大数据,特别是轨迹大数据的时候要先评估大数据成果的可用性。

图8

现在经常提“大脑”,我觉得“脑容量”很大,“大脑皮层”还很光滑,基本上还不能像人一样去思考。大数据只有在实战中才能磨炼出有实用的价值。

作为大数据的用户,我很认同大数据未来的使用方向,但是怎么去用?我得出的结论是必须在每一个环境、每一个时段下都去分析这个大数据,分析厂商提供的大数据成果是否具有可用性,然后需要“地面部队”的配合将这些数据做好评判。

我认为大脑直接接到前端设备,全自动化还太远,应该是给交通工程师外挂一个大脑,做辅助决策或者专家系统才是正道。

人的能力是有限的,但是交通工程师的判断能力很强,所以我希望是互联网巨头们有兴趣的话应该给我们做一个外挂的大脑,不要总是想着要直接给信号机下发方案。

 

交通信号优化服务分级

赶上“两化”春风,很多城市都在笼统地说购买交通信号优化服务,各地交警支队、大队好不容易申请到经费之后发现有一种信号优化服务叫做“别的城市购买的信号优化服务”。

所以我觉得有必要说一下交通信号优化服务等级,我写这个目的是作为信号优化服务从业者,我们应该给自己制定一个标准,规范自己。

图9

I级: 优化完有效果就撤

II级: 驻点优化

III级:驻点优化+台账管理+日常巡查+流程标准

IV级:驻点优化+台账管理+日常巡查+流程标准+早晚高峰值班

V级: 驻点优化+台账管理+日常巡查+流程标准+早晚高峰值班+舆情处理

VI级:驻点优化+台账管理+日常巡查+流程标准+早晚高峰值班+舆情处理+交管措施宣传化服务

当然,不同的等级还会有不同的收费,目前至少要做到二级。所以信号优化服务不仅是技术上的辅助,更是管理上的辅助,一分钱一分货。

 

总结

图10

都说大数据是宝贵的资源,但是大数据不是煤矿,而是金矿!煤矿挖开了就能用,金矿提炼起来很费劲,不是说数据拿出来了就可以用,但是提炼出来了价值就很大。

我也是一直期望着有技术实力的互联网巨头们能够以提炼金矿的态度把这些价值提炼出来,然后让一线用户用好。

 

(文章摘自赛文交通网官微,文章链接:https://mp.weixin.qq.com/s/NaObT0OcfqSgC0cPWhoLBw