论文详解：滴滴大数据预测用户目的地，准确率超90% | KDD 2017

滴滴分单优化预测目的地 KDD 2017

2017/08/14 18:06

雷锋网 AI科技评论按：在KDD 2017中滴滴研究院副院长叶杰平所带的滴滴团队关于出租车组合优化分单模型和目的地预测的论文《A Taxi Order Dispatch Model based On Combinatorial Optimization》被收录。雷锋网将对这篇论文进行详细解读。

论文解读

相比于在搜索引擎中找到一个想要的网页，在茫茫车潮中匹配到一辆载你去目的地的车辆会更加复杂。因为网页可以持续呈现一整天，甚至半个月；但车辆是高速移动的，乘客和司机的相对位置一直在实时变动。匹配的过程和方式也极其重要，在一个既定区域，乘客有很多，车辆也有很多，系统需要全局考虑区域内的需求、供给，以毫秒级的速度进行计算，实时地进行最合理的分单，最大化用户的出行效率和出行体验。

这篇论文中介绍在滴滴出租车中使用的基于组合优化的分单模型，该模型相较于别的分单模型，整体成交率得到了提升。此外为了进一步提高用户叫车时的体验，滴滴还开发了一个目的地预测模型，能在用户打开软件时，2毫秒为用户推荐出他最可能前往的地点。目前这一功能的预测准确率已经超过90%。

1、分单时优化整体成交率

早期，出租车打车软件的订单分配主要聚焦在每个订单与每个出租车司机的相关性算法上。当一个乘客发起一单需求，系统会尽量匹配调度最近距离的司机，力图让接驾时间最短。然而此时往往会忽略到这些司机是否更适合其他订单。

此前业界曾提出过一个基于多代理体系结构的新模型NTuCab，它的目的是最小化乘客的等待时间和接驾距离。这一模型会将每个代理视为一个计算单元，它会同时计算处理N个订单和司机的匹配，但一个订单只会匹配一个出租车司机。如果一个出租车司机拒绝该订单，系统才会转发给下一司机。

然而这些方法的调度时间往往偏长，成功率较低。对此，滴滴出行提出了新的组合优化方法。在这个模型中，一个订单会播报给几个出租车司机，当多个出租车司机收到相同的订单时，最先抢单的人会获得订单。如果订单未被应答，则进入下一轮播单，直到它被出租车司机应答或被乘客取消。而模型的目标则是最大化订单成交率，从而确保司机和乘客的出行体验。实验数据也显示，这一模型下打车的全局成功率比同类模型高出了4%。

在滴滴的模型中一个主要的改进是使用“整体”的概念，即会整体考虑当前时刻所有待分配司机和订单群体的多对多的匹配问题。以成交率为优化目标，通过整体分配司机与乘客，提升乘客订单的整体成交率。

模型的数学形式即：