北京化工大学经济管理学院李想教授
一、模式变革
最近几年,我们国家的交通,包括城际客运、城际货运,或者是城市的交通都发生了很大的变革。比如出租车,几年前都是巡游车,乘客不管是刮风下雨都需要站在路边向出租车司机招手,才能获得服务,如果车里有人,还要等待下一辆,导致乘客出行不便。同时,出租车司机也不方便,乘客可能不知道司机在哪儿,所以导致司机接收不到业务。
最近几年网约车的出现极大方便了司机与乘客,通过把供应与需求放在网络平台上进行有效匹配,一方面减少了乘客的等待时间,另一方面也使司机接收更多的业务和订单,所以对双方都有好处。
能够产生这种模式变革的主要原因一方面是得益于数字化技术的提升、传感技术的提升,以及精准识别技术;另外一方面就是得益于大数据技术的提升,因为在网约车技术背后有精妙的定价算法、投放算法、匹配算法等支撑。所以模式变革既得益于数字化的提升,也得益于大数据分析能力的提升。
在城市轨道交通方面,特别是地铁方面,十几年前我国的地铁技术就有辅助驾驶系统。辅助驾驶系统能够精准地感知车在隧道中的位置。现在,我国有了自动驾驶系统。自动驾驶系统不仅能够精准地感知列车在隧道中的位置,也能实时感知列车的状态,比如列车的加速度、速度,对它施加的牵引力、施加的外力数值以及轨道的坡度、曲度等。
地铁运营管理中最重要的是保障安全,确保在隧道内的两个车不能撞到一起,所以要保证两个车之间有一个安全距离。安全距离就是假设前车瞬间制动停止后,后车做紧急制动的距离。但是,一个物体的刹车之后不能立刻停止,如果无法感知前车的加速度、速度,或者是位置,或者感知到了之后不能把它及时的利用,就会增大安全距离,导致运量的浪费。通过自动驾驶系统,我们可以感知到前车的加速度、位置,以及速度、施加的外力,再根据运动方程就能判断后车与前车之间距离缩小到多少的时候,它俩可以同时停下来,并且不会撞上,这样可以极大减少发车间隔。现在我国地铁的发车间隔已经做得很小,比如北京地铁高峰期可以做到90秒,但是如果把车与车之间实时感知的技术用上之后,可以进一步缩小安全间隔,从而提高运力。
在10年前或者十几年前,地面常规公交车是支付现金购票。在那种场景下,公交公司是很难精准地识别客流的需求,比如从第3站到第5站究竟有多少需求,要配多少车,只能依靠售票员或者是调度员的经验。另外两车之间的间隔也很难判断,只能依靠人类的经验。现在通过IC卡这些智能设备,车载GPS,我们能精准地感知到任意一组OD之间,任意一个始发站到终点站之间,究竟有多少需求,旅行时间是多少,可以把它完整地记录下来,这样就有利于提高公交的运营管理。
还有一个是城际货运的模式,这里指的主要是物流,城际之间的干线运输。以前的干线运输往往会出现以下问题:货车司机把货从厂区拉走之后,一直运送到目的地,在到达目的地之前货主和需求方都无法跟踪到车辆。这会导致司机可以偷偷地去做一些其它的事情,比如他还可以再接另一单货,给自己增加收入,因为车的位置不可见,货主和需求方无法发现这个问题。司机还可以把车上的真货调包,最后出现质量问题的时候,很少有人能想到是司机的问题。还有运冷链货品,比如说速冻饺子、速冻汤圆,特别是运疫苗的时候,司机偷偷地把空调关了,快到目的地的时候才打开,这时候东西还是冻在一起的,但其实产品已经变质了,这是传统城际货运遇到的问题。后来通过在车上装各种各样的传感器,比如说温度传感器、压力传感器、GPS、视频、电子锁等等一系列的设施,把货车透明化了,它的货主和需求方都能实时看得到,避免产生问题,因此就出现了现在的第四方物流采取的方式。
除此之外还有很多交通模式变革,这些变革都得益于数字化技术的发展以及大数据分析能力的提升。
二、运营数据
交通出行模式的变革,一方面得益于数字化技术的进步,得益于大数据感知、认知、决策能力的发展,同时它也极大丰富了运营数据。以前售票员手工记录数据,或者地铁能感知到位置的数据不是很全面,现在我们能感知到的数据越来越丰富。我们把数据分成四种维度,第一种是基础设施的数据,比如公交场站的位置、公交港湾的位置、车辆的数据;第二种是业务数据;第三种是IoT数据,比如GPS、IC卡数据;第四种是一些外部数据,比如社交媒体、评论数据。总体来说,我们把数据分成这四个维度,并不是传统的交通行业里面不用这些数据,只是用得很少,或者说可用的数据很少,而目前进入大数据时代,各方面的数据都很全面,可以供我们为交通运营管理做各方面的分析。
图1:四种维度的数据
具体的数据精细到什么程度呢?在运营管理这一块,在共享交通这方面,会有共享单车、网约车订单的数据。在地铁方面,会有ATO的数据(ATO数据需要一秒钟之内采集5次,每次包括采集时间、车的位置、车的加速度、车受到的外力、坡度、曲度、车身的重量等等)。在公共交通方面,会有公共交通数据,包括公交车、出租车的GPS和交通卡刷卡的数据。还有交通环境数据,它主要是路网的拥堵情况。以及人群流动数据,它主要是通过手机信令来收集。这是从运营角度我们可以利用的数据。
通过这些数据,企业能够提升业绩、降低成本,我们可以用这些数据发现一些传统研究中没有数据发现不了的问题,有了数据之后,我们就能把这些问题挖掘出来。比如网约车的一个重要问题,也是最近在交通领域研究里面特别热点的问题,就是网约车的定价,网约车定价需要基于需求数据、供应能力数据,包括要给乘客进行定价,也要给司机的工资进行定价,同时还要做激励机制等多个方面,基础就是供需。供需这一块,传统没有数据的时候,好多学者提出来许多经验模型,比如道格拉斯模型、行程匹配模型。现在通过大数据,还用这两个模型把工作更加优化。但是这里面一个问题,我们可以用真实的乘客下单数据以及路面上活跃的网约车司机数量的数据,通过一供一需做出分析,对比传统的道格拉斯模型和匹配模型的偏差,发现偏差还比较大,这表示并不是说某一个路段或者某一个地区永远是道格拉斯模型,永远是匹配模型。比如高峰期的时候道格拉斯模型可能拟合度更好,平峰期的时候行程匹配模型更好,这一点就是通过数据分析出来。
在轨道交通研究方面,传统运营管理的一个核心的基础就是要知道地铁在隧道中间是怎么运行的,它走出的速度曲线是什么。但是研究人员很难知道这条曲线是什么。这时候就要用理论模型去研究,用Pontryagin最大值原理,分析出最节能的曲线。学者都通过这个模式来研究地铁的驾驶。现在通过地铁的OTA数据,我们能实时感知地铁的速度、加速度。感知结果表明地铁起步的时候是最大加速,其间有匀速、放空档的状态,但是没有最大制动,地铁采取点刹的形式,因为如果在高速状态下采取最大制动会损失乘客舒适度,地铁运营不止以节能为主,主要还要兼顾安全和舒适。所以这又发现一个问题,看上去经典的Pontryagin最大值原理,和数据一比对并不正确。所以,是继续用这个漂亮的结果发展这套理论,还是用很复杂的数据来发展这套理论?这个也是我们需要思考的一个问题。
图2:城市轨道交通数据
地面公交存在这个问题,传统上大家都会感知公交车在两站之间的旅行区间,学界做的假设最多的两站之间的旅行时间为正态分布或者是均匀分布等等一系列的分布,看上去都很漂亮,但实际利用真实采集回来的公交车GPS数据,绘制的图离正态分布的偏差很大,根本不是正态的,也不是均匀分布的。我们把概率统计里面那些经典的分布都套进去,发现都不对。所以对于公交运营管理呢,不能再基于那些各种分布的假设,只能基于真实数据。可是具体怎么做,也是值得我们思考的问题。
对于城际货运的数据,企业和高校都做路径规划,但是一个是使用派,一个是学院派。比如要从北京到上海选择路径,学界的做法是要不然让成本最低,要不然让时间最短,油费最短,在中间用网络优化的方式选择一个。企业的做法是利用历史数据得出每条路径的选择占比,比如选择线路一的占比是16%,选择线路2的占比是43%,就把43%的线路推荐给司机,虽然企业没用到科学的方法,但是考虑到了许多细节问题。比如同样是线路1、线路2,从实际情况来看,大车喜欢走线路2,但是小车喜欢走线路1。我们在现实中很少考虑大车和小车有什么区别,在模型里是体现不出来,但是实际跑出来的数据有这个统计。所以这也给我们一个提醒,对于数据驱动下的交通运营管理,现在学界和业界的做法是有很大区别的。
三、数据运营
现在我们能够采集到的运营数据越来越丰富,运营数据丰富的同时,它极大地推动了数据运营的发展,数据运营的概念不再是从数据到模型最后给出解决方案,而是直接基于数据给出解决方案,所以要做好从运营数据到数据运营的转变。
图3:数据运营
举个例子,现实生活中有很多交通大数据,管理人员要做的就是基于数据做各种决策,传统不是从数据出发,传统研究认为我们总能得到很好的需求、很好的旅行时间,然后就基于这些继续开展决策优化。如果随机变量和区间能够很好地获取,我们把它嫁接到决策优化模型上就可以。但问题是现实的大数据得到的信息与知识,没有我们想象中的那么完美,并且偏差还比较大,所以就要改变决策、交通运营管理的模式,不能再从想象的信息与知识开始决策。这里面存在一个问题,从信息与知识到决策是管理学的范畴,从底层数据到信息是数据的层面,这两者的偏差比较大,把它分开研究再组合会产生什么效果呢?就好比分别从两端建桥,最后两边对不上,导致返工。所以在大数据时代,交通运营管理一定要从底层数据直接出发,把数据科学、信息科学与管理科学结合起来,最终才能得到实际可用又有一定理论创新的方法。