同济大学经济与管理学院 王晓蕾 副教授
一、研究背景
动态拼车是一种实时响应用户的拼车需求,边服务边寻找拼车对象的服务模式。它和传统的拼车模式相比,区别在于传统的拼车模式下,一般是先配对找到可以拼车的伙伴,然后才会出发,平台才会派车。但是在动态拼车模式下,当用户有一个拼车需求,发送给像滴滴这样的平台以后,它会立刻给用户派车,也许是一辆已经载着乘客的车,也许是一辆空车,如果是一辆空车的话,它会在沿途持续的搜索,寻找可以跟用户拼车的伙伴。
图1:“传统拼车”与“动态拼车”
滴滴在去年年底的时候由原来的滴滴拼车改为了青菜拼车,青菜拼车跟原本滴滴的拼车服务相比,变成了两种功能,一种是拼成出发,另一种是立即出发。拼成出发对应传统拼车,用户要拼成功了才能出发,所以需要提前一段时间去预约,平台是有一段时间可以供它来积累拼车的需求,以便找到可以跟用户拼车的对象。而“立即出发”功能就是动态拼车服务。
随着交通大数据的丰富,动态拼车在现实应用中的可行性已经得到了有力的证实。MIT的可感知城市实验室在过去10年当中用纽约的1.7亿的出租车数据,针对动态拼车服务的可行性以及社会价值进行了大量的研究,研究发现动态拼车模式下存在合适拼车对象的订单的比例和拼车用户的规模,以及用户的最大允许的延误时间是息息相关的,如果城市当中现有的出租车订单全都转化为拼车订单,几乎每个订单都可以成功地找到拼车的对象,所导致的乘客最大延误不会超过2分钟。也就是说当用户的需求规模积累到一定程度以后,动态拼车模式下是很容易为用户找到一个拼车的对象,两分钟的延误对用户来说也是比较可接受的。
图2:MIT研究结果
他们的研究也指出,动态拼车对于减少小汽车行驶里程、提升出行服务效率具有巨大的潜力。他们提出一种算法,可以计算在拼车模式下最小需要的车辆数,通过动态拼车,纽约市能够减少40%的出租车,就能够达到和现在等同的服务水平。所以它对于减少小汽车行驶里程,提升出行服务效率是具有巨大潜力。
未来当无人驾驶时代到来的时候,小汽车出行将变得更加的便捷、更加的便宜,导致小汽车出行需求大大增加,如果没有动态拼车,我们的城市会变得更加的拥堵。所以动态拼车加无人驾驶才是未来城市交通的一个发展方向。但是能不能实现动态拼车的社会价值,高度取决于动态拼车平台的运营能力。首先动态拼车模式能够实现的里程节约是和拼车的需求规模以及拼车的质量,也就是每一个订单的绕行里程是多少、节约里程是多少、拼车成功率是多少这些指标息息相关的,拼车的需求一方面取决于拼车的价格,另一方面也取决于平台所能达到的拼车服务的质量。而另一方面拼车的服务质量又高度取决于拼车的需求,平台对于拼车线路规划的能力以及它的匹配策略的优劣。所以对于动态拼车的运营来说,它的定价问题、路径规划问题,以及它的匹配策略问题是它要解决的三个重要的运营决策问题。但是每一个运营决策,在它要决策的当下都要面临巨大的不确定性,这会给动态拼车平台的运营带来巨大的挑战。比如动态拼车的定价,滴滴拼车原来的模式是一口价的模式。用户输入起点和终点以后,它就会立马告知价格,不管是拼成还是没拼成,用户都可以享受这个折扣的价格。但是定出这样一个价格,需要考虑这个订单能不能够拼成,能够带来的里程节约有多少,如果拼成的话,用户会经历的绕行距离大概有多少,对平台指标的预测提出了很高的要求。
图3:动态拼车的几个关键运营问题
在去年年底,滴滴拼车取消了一口价的模式,可能他们对于拼车订单的成功率,绕行里程以及节约里程的预测能力还不足,现在他们的“立即出发”已经改成必须要在确定拼成之后才能享受到折扣的价格,相当于平台不再承担这个风险,对于它的预测的压力也就大大地减小了。但是如果说能够提升它这方面的预测能力,仍然可以采用这种一口价的出行模式,对乘客来说更加有吸引力,对于提升需求规模,更好地发展动态拼车是非常有价值的。
对于路线规划问题,如果不是拼车模式的话,可能乘客就会选择最短的路径,或者是费用最小的路径,但是在拼车模式下,平台会希望用户去选择一条匹配成功率比较大的路径。到底什么样的匹配路径比较高呢?这也是对订单成功率的预测问题。
还有一个问题是在动态拼车模式下的匹配策略问题,当平台收到用户的订单以后,它可能很快就在附近发现了能够匹配的车辆。但是要不要在当下就进行匹配,这是不是一个最优的选择,如果派一辆空车来接乘客,在未来整个途中是不是可能碰到更好的拼车伙伴。如果周围没有拼车伙伴的情况下,那平台应该让这个乘客再等一等还是即刻派一辆空车。也许对于一些OD来说,平台即刻派一辆空车,在未来的途中可能就很难再遇到乘客了。这也是对这个平台的预测能力提出了很高的要求。
二、动态拼车的订单拼车成功率和预期绕行/共乘里程预测
为了解决这个困境,我们对动态拼车订单的拼车成功率、预期绕行里程和预期共乘里程提出一种预测方法,来辅助后续的三个重要的运营决策问题。
现在有许多关于动态拼车的研究,但是关于动态拼车模式下订单的拼车成功率、预期绕行里程和预期共乘里程预测的研究,我们还没有找到任何相关的研究发表。虽然现在有非常多的网约车公开数据,但是却没有关于拼车的数据,没有关于一个订单是不是拼车成功的字段数据,所以在理论上还没有相关的研究发表。但是关于动态拼车运营优化的研究其实不少,主要是关于动态拼车的派单优化,这些派单优化的研究一般是采用插入式、启发式的算法,当平台在接到一个订单的时候,它就是要立刻决策插入周边哪一辆车辆的任务队列里面,使得对于车上已有乘客的影响最小,对于司机的收入的提升贡献最大,或者对于平台的收入的贡献最大。这些派单优化相关研究的主要缺陷是只考虑已经发生的订单,不考虑未来的拼车需求,因为它不做任何的预测。
如果对于一个动态拼车的订单,我们想要去预测它的拼车成功率、预期绕行和共乘里程,主要的难点在哪里?首先对于动态拼车来说,平台需要有一个匹配的条件,这个匹配条件一般有两个,一个是两名乘客的当前距离不能太远,不能超过一个阈值R,不可能跟一个很远的乘客匹配,这边的乘客就要等待非常久的时间;第二是匹配以后两个乘客的绕行时间都不应该超过一个最大绕行时间,在这两个条件底下,我们就发现当平台判断一个订单能不能跟当前订单匹配的时候,不仅要考虑乘客的起点,还要考虑乘客的终点。
其次,在沿途平台随时为乘客匹配拼车的对象,乘客在每个位置都可以匹配,乘客的位置随时间不停地变化,匹配的点也是不断变化的,比如当这个乘客还在起点的时候,他可以和正在这边的一个乘客进行匹配,但是当他再前进一段时间之后,就可以与另一个乘客匹配。他在不同的位置与不同OD间的乘客进行匹配,就会导致不同的绕行历程和共乘里程及因此要预测预期绕行里程和共乘里程,就需要预测在不同的订单的匹配的概率。
在不同的OD需求之间存在复杂的竞争与合作的关系。比如从A点出发去往B点的乘客,我们想要知道他和C、D间乘客匹配的概率,显然当他到达B点的时候,会跟C点出现乘客的发生率有关,但是C点出现乘客不仅取决于C、D的需求率,因为这个C、D的乘客不仅可以跟A、B之间的乘客进行匹配,他还可以跟其它OD之间的乘客进行匹配。F的乘客也未必要和C、D乘客匹配,他在来的过程中可能已经被其他的乘客匹配了。所以在不同的OD需求之间如图4所示,乘客的行程表代表了不同的路线,红色的代表它们之间不同位置的匹配关系,在不同的OD之间有不同的匹配关系存在,导致要预测这个订单在某个位置和某个OD间的订单的匹配概率,所以几乎要考虑这个网络当中所有OD间的拼车需求。
图4:不同OD拼车需求间的竞争与合作关系
为克服这些难点呢,我们基于数学建模的方法,首先假设每个OD间的拼车需求服从均值给定的泊松分布,这是一个很大的简化,相当于放弃了对于OD之间拼车需求的预测,我们假设这个预测工作是已经完成的,它的均值是已知的。每位乘客沿途只与一位乘客匹配,比如这个乘客在到达这个点的时候,被匹配给这两个点之间拼车的乘客,司机接了这个乘客以后,他们之间就发生了拼车,之后当司机放下这个乘客以后,这个乘客现在单独在车上,他不会再与别人进行匹配,这也是一个比较重要的简化。
匹配条件就像我们前面提到的,考虑两个乘客的当前距离,以及匹配以后的两个乘客的绕行时间不能超过一个阈值。在这个匹配条件下,只要有一种情况满足我们的匹配条件,我们就认为它是可以进行匹配的。
模型基于特定的搜索框架,假设这个平台采用的搜索方式是当这个乘客首先出现在起点的时候,平台会为他进行初次的搜索,如果找到了拼车对象,这两个乘客就拼车成功了,如果没有,平台会让这个乘客在原地等待一定的时间,在等待的过程当中,这个乘客就有可能被别人匹配。如果确实被匹配了,也是匹配成功了。如果没有匹配成功的话,平台会立刻派空车接驾,空车接驾以后,沿途经过每一个搜索点,平台会为他进行搜索,所以这个乘客可能在每一个搜索点的时候找到与他匹配成功的对象,也可能在两个搜索点之间的沿途行驶的过程当中,被其他的乘客给匹配。
图5:搜索框架
基于这样的搜索框架,我们建立了一个三步的预测模型,第一步把每一个OD之间的路径分成多个Segments,每一个Segment的起点对应了一个搜索点,就是为乘客进行主动搜索的点,因此乘客就可能在这个搜索点上发生匹配,也可能在段落上发生匹配,我们要预测的就是它在这个点上匹配的概率,以及在段落上匹配的概率。有了这两个信息,我们就可以很容易地计算这个上面的匹配概率。
第二步,我们针对每一个Segment和point定义它匹配的段落和Segment,基于这个信息,我们可以进一步计算出如果匹配成功,同时基于每一个点,以及每一个Segment上的匹配成功率,我们就可以进一步计算出预期的行驶里程和预期的共乘里程。关键是怎么样计算它在每个点和每个point上的匹配成功率。
具体来说,我们定义了6种变量,为了计算这个点和point上的匹配成功率,我们定义了每个点上的到达率,以及每个点上面未匹配的状态的离开率,以及每一个段落上面存在可匹配乘客的概率。同时还有任意点和段落之间的匹配的速率,我们通过刻划这6个变量之间的相互影响的关系,建立了一个以每个OD的平均需求率以及节点与段落的匹配关系为输入的预测模型,通过计算这样一个非线性方程组,我们就可以同时得到每个节点的匹配成功率。
关于对预测准确率的检验,因为没有现实的数据,所以我们在30×30的网格网络上面进行了仿真,随机生成了300个OD对,以及不同的拼车的需求。我们计算了不同的场景底下不同的需求率,不同的仿真值和理论计算值。这是两个仿真值和理论计算值比较以后的均方根误差和平均绝对比误差。发现均方根误差对三个指标:匹配成功率、行驶里程、共乘里程,误差均是在10%以下,可见精度非常理想。
三、总结
我们提出了一个同时预测所有OD间拼车成功率、预期绕行和预期共乘里程的模型,它和仿真实验比较得到一个非常理想的效果,我们现在在做的工作是进一步把它推广到基于大规模的现实路网的场景中去验证这个模型的有效性,以及基于这个模型进行的动态拼车对价的全局优化和前瞻性派单策略的优化。