雷锋网 AI 科技评论按,2018 滴滴科技开放日上,滴滴产品技术管理团队与高校学生、专业技术人员展开面对面交流,详细介绍了滴滴在大数据、人工智能领域的最新科技成果,重点分享了滴滴在智能派单、地图、拼车、供需预测、智能客服、语音识别等领域的实践经验。凭借此次活动,滴滴在雷锋网旗下学术频道 AI 科技评论数据库产品「AI 影响因子」上有相应加分。
活动现场,滴滴 CTO 张博、滴滴智能出行部负责人郄小虎、滴滴 AI Lab 负责人叶杰平教授分别上台发言,从未来展望、数据智能和 AI 创新三方面分享了滴滴的实践经验。值得一提的是,活动也邀请到德国著名机器人学家、德国最高科研奖“莱布尼茨奖”得主、IEEE(电气和电子工程师协会)机器人与自动化学会主席 Wolfram Burgar,他分享了其团队在高精度定位、地图构建、探测及分类、自动导航等方面的试验和探索。
活动现场,除了精彩的发言,滴滴还宣布成立 AI for Social Good 共创平台,主要关注环境、安全与健康、科技无障碍三大领域方向。滴滴表示,将充分发挥自身在大数据、人工智能、云计算等领域的优势,开放合作,通过整合学术、技术、资金等资源,携手合作伙伴共同发现、定义问题,并为相应主题研究课题的落地实践提供全方位、多元化支持。
AI for Transportation
滴滴出行 CTO 张博在开场演讲中指出,过去二十年,互联网和移动互联网的发展基本上解决了信息的流动问题,而滴滴希望解决的是物理世界人和物体的流动问题,滴滴在未来的想法是 AI for Transportation。
在张博看来,滴滴在未来对交通系统的优化分三层结构:
最下面一层是交通基础设施,这里包括智慧红路灯、高清度摄像头等;中间一层是车辆交通工具本身的变革,滴滴正在合作建设充换电站体系,也在加大力度研发快速充换电站,智能化、新能源化将是趋势;最上层则是共享出行网络,张博表示,未来会有越来越多的人选择共享出行。
他提到,滴滴希望给城市规划部门做一个模拟系统,比如规划修地铁、修公路时,可以先事先模拟,这样的设备会让人们的出行变得更好。他也表示,滴滴现在正加大力度做拼车,他们希望把共享单位从汽车降为座位。他重点强调到,现在要想解决道路拥堵问题,没有什么比拼车更高效的方式。
滴滴 AI Lab 负责人叶杰平教授详解了滴滴 AI 的三层布局,重点展示了滴滴在智能客服和语音领域的新进展。
他们利用用户在对话中输入的文本信息,这里包括现在和过去的信息,此外还利用用户的特征、最近订单的特征来建立深度学习模型进行预测,定位用户潜在的问题。他表示,最近他们也开发了基于知识图谱的多轮对话。
他也进一步表示,虽然目前语音客服还不能取代人工客服,但在语音辅助这个环节,语音的潜力非常大。基于滴滴的语音技术,他们最近开发了一套语音交互系统,通过这一交互系统,用户可以通过语音与系统进行交互,实现多种功能,例如收听音乐,查询航班信息,查找最近的加油站、充电站等等。
他说道,未来这一套智能语音交互系统会让出行更加智能、更加安全、更加便捷。
滴滴背后的大数据智能
除了张博和叶杰平所分享的内容,滴滴智能出行部负责人、滴滴出行副总裁郄小虎以《出行交易中的大数据智能》为题,向现场观众介绍了滴滴出行交易中的大数据智能。
他表示,滴滴有超过 5 亿 5 千万乘客,有超过 3000 万司机,在这样一个庞大的出行交易平台上,从用户打开滴滴 App 的那一刻,滴滴的大数据技术就开始在背后帮助用户打造美好的出行体验。
他详细描述了滴滴如何为乘客推荐上车点,如何进行路径规划,如何预估到达时间等等。他表示,当需求比较紧张的时候,他们还为用户提供拼车选择,解决运力短缺问题,这其中涉及到多目标、多模式的优化。以下为雷锋网 AI 科技评论对这些技术的整理总结。
基于大数据打造美好出行体验
首先用户需要表达出行需求,比如需要去哪里,需要在哪里上车。之后滴滴会根据用户的出行需求,为用户选择一位最优的司机接驾。在之后的行程中,滴滴还会对司机进行路径规划,找到一条最优的路线,用最安全、最便捷的方式,把用户送到目的地。
为了完成这样一单,背后需要很多大数据的技术,包括如何推荐上车点,如何进行路径规划,如何预估到达时间等等。当需求比较紧张的时候,还需要为用户提供拼车选择,把多个不同的乘客拼在一起。
先从行程开始,滴滴要为用户推荐一个上车点,这是在实际出行中很令大家头疼的一个问题。很多时候因为司机把车停在了一个很难停车,或者不能停车的地方,如果乘客晚到了几分钟,司机就要绕一大圈,或者调几个头,很多时候会造成行程没有办法完成,这会导致用户体验非常差。但是现在业界并没有一个能解决这个问题的成熟办法,目前已有的地图服务不能告诉我们哪里是一个好的上车点。
为了解决这一问题,在滴滴的平台上大量采用了计算机视觉技术,来分析现实世界中获取的图象信息。滴滴目前的技术可以识别图象的交规信息,如路面上的划线,是不是公交车站,以及路面上有没有隔离的桩,通过这些信息可以判断这个地点是不是适合停车。
在现实世界中这种交规和道路信息是瞬息万变的,如何能够及时采集这些信息,这对推荐上车点有非常重大的影响。滴滴平台的优势,是其在每一个城市都有大量的轨迹数据。因为滴滴有很大的覆盖度,所以可以通过大数据挖掘的方式,及时监测到交规的变化,这样可以做到接近实时的交通数据的更新,能够保证为用户推荐的上车点是一个最合理的上车点。
推荐上车点只是第一步,那么下一步乘客如何能够找到这个上车点?在现实生活中,如果是在机场、车站、非常复杂的室内场景,经常会遇到很多尴尬的情况,这时候乘客需要像穿越迷宫一样才能找到上车点,很多时候也会造成很多困难。为了解决这一问题,滴滴正在准备推出一个基于 AR 技术的步行导航,能够引导乘客在复杂的环境下顺利到达上车点。
通过视觉定位以及 3D 视觉建模的能力,可以保证定位的精度控制在 1 米之内,这一精度远远优于现在的所有定位技术。WiFi、蓝牙、超宽带以及 GPS 等在这样的场景下应该都比较差,滴滴即将推出的方案远远优于现在所有的解决方案。他们近期会在北京的一些场站内开启实景导航服务,大家如果感兴趣,可以进行体验。
滴滴为乘客选择了上车点之后,下一步需要为这个乘客选择司机。如何在海量的乘客和司机之间找到一个最佳匹配,这是非常有挑战性的数学问题,也是一个算法问题。
首先需要考虑这一次分配是要保证乘客有最佳体验,每位乘客都希望有一辆离他最近的车,能够在最短的时间之内提供接驾服务。同时,滴滴也希望司机能够在整个行程中,给乘客提供很好的出行体验,保证安全,而且服务达到一定的标准。
从司机的维度来看,滴滴希望通过这种分单的决策,让司机的收入得到优化。在供需不足的场景下,还需要把相似路线和时间的出行需求,通过拼车这样一个产品方式来解决。
拼车匹配问题
拼车是一个非常复杂的匹配问题。在滴滴的出行场景里,有多条产品线,用户可以叫出租车,可以叫快车、优享,以及专车。在很多供需不匹配的情况下,如果当前的快车线没有司机,但是优享是有司机接单的,这时候还需要根据供需实时变化,在不同产品之间进行动态分配,以给用户提供更多的选择。
整体来看,这个匹配问题其实是一个多目标、多模式的优化问题。在这里要考虑用户的发单请求,以及所有不同产品线上供给的情况,来寻求一个最佳匹配。根据供需的变化,滴滴也需要对这个算法做动态的调整。比如说在供需相对平衡的情况下,他们希望每一次分单可以在保证用户体验的同时,能够优化司机的收入。
在滴滴这样一个出行平台上,每一个司机、乘客,实际上对应了在格子上的一个点,每一次分单的决策,等于把司机和乘客在这个时空网络中从一个点挪到另外一个点。这就像下围棋一样,下棋的每一步会改变棋盘的状态,未来的状态会对之后的棋盘状态产生影响。
因此,每次分单的决策不仅仅影响了当前这一单,还会对未来一天出行网络中的状态产生影响。这其实是一个深度学习需要解决的问题,滴滴团队开发了这样一种算法,它能够针对一天的状态在一个正常时空维度上进行多目标优化。
在供给相对充足的情况下,滴滴会优化用户的体验,尽量为乘客派一辆离他最近的车辆。
在供需非常不足的情况下,滴滴提供了排队的解决方案。他们的系统会实时检测,在哪一个区域当前的运力极端紧缺,这时候所有乘客的发单请求会自动进入排队系统。
下图这幅图显示了北京的排队情况,如果是红色,表示这个地区的乘客都在排队,运力极端缺乏。如果是蓝色,说明运力相对充足。
当系统进入排队情况的时候,滴滴也会通过调度的方式,让更多的司机、更远的司机过来,满足这些用户的需求。他们会给乘客一些选择,比如通过打表来接等这样的方式,调度更远的运力。
如果只是为一个乘客分配一辆车,还不能够真正解决运力短缺的问题,也不能够充分利用现在的道路以及运力资源。所以,拼车是一个非常有效的满足更多乘客需求的方式。
如果能够共享车辆资源,可以用更少的运力来满足乘客的出行体验。这里一个核心的问题是,如何把在时间、空间、目的地相近的出行需求组合在一起。通过这样的组合可以增加资源利用率,同时也为乘客提供一个更加便宜的出行解决方案。
拼车背后是一个更加有挑战性的技术问题,这里不仅需要考虑一个司机和乘客之间的匹配,同时也要考虑多个不同的出行请求之间的相似度。在这里,一个核心问题是路径规划,它和传统的路径规划有很大的区别。在传统的路径规划当中,重点考虑的是这条路径的行驶时间,以及距离等等。但是在这里,需要考虑在这一条路径上,可能载到下一个乘客的概率有多大。
当系统判断出有多个乘客的需求可能会被拼到一单的时候,还要决定接驾顺序。比如在下图的例子里,如果有 A、B 两位乘客,路径规划应该是先接 A,然后再接 B。先把 A 送到目的地,再送B。这只是两个乘客的情况,3 个、4 个会有更多的排列组合。路径的规划和拼车算法都需要解决排队组合和算法的问题,而且它的难度会随着拼车的规模呈现指数级增长。
预估到达时间
行程开始之后,滴滴需要为用户提供到达时间预估。预估到达时间是一个相对在业界已经被研究很多年的问题。业界通用的衡量预估时间的一个指标叫做 MAPE,它是平均预估偏差。在很长一段时间之内,这个指标是没有什么变化的。因为大家都是用了一种线性方式来预估到达时间。
滴滴是国内首家通过机器学习的方式来解决预估时间问题的企业。这一技术的上线显著降低了预估时间的偏差,提高了准确率。
路径规划是一个传统的图论算法问题,也有很多启发式的算法来解决。滴滴用了一个全新的角度来看路径规划,因为其有大量的历史、轨迹数据,他们把路径规划问题转化成一个搜索和排序问题。系统会不断学习,根据司机的行驶轨迹去挖掘。如果一个司机没有走滴滴为他规划的路径,那说明这条路径可能有一些大家不知道的特点。通过不断的学习,历史数据会越来越丰富。
当把这些数据召回之后,可以针对当前的路况,根据当前的时间,以及用户的偏好等等,为其选取一条最优路径。路径规划需要现实世界中的路况数据,这一数据也是瞬时在变化的。如何准确体现现实世界中路况分分秒秒发生的变化,这里也用到了在滴滴平台上大量的轨迹数据。
这些大数据的技术让每一单的出行体验变得更好,但是在整个出行平台当中,最要调整的一个问题还是供给和需求不匹配,这一问题的解决需要在宏观上对供给和需求在时间和空间上进行调整,让它们更加一致。
如下图所示,这幅图显示北京在供给和需求之间的差距。这里把北京大概分成了 1 万个格子,每一个格子的颜色显示了供给的不平衡。如果是红色,说明运力极度缺乏。如果是绿色,说明司机相对充足。这里体现出非常强的潮汐效应,每天在高峰期,在一些核心区域,运力极度缺乏。
如何解决这一问题,首先需要对供给和需求作出非常精准的预测。在这方面,滴滴通过机器学习和大数据算法,投入了大量工作,目前已经达到很高的准确度。在预测的前提下,还需要利用调度算法,让司机出现在乘客最需要的地方。
从上面这幅图里可以知道很多区域是缺司机的,但是有些区域的运力是充足的。在调度决策上,滴滴开发了一套算法来计算在每一个时空节点上,增加一个司机所产生的边界效应。在这个时空节点上,如果有一个司机出现,他能够带来多少单的改变。那么在这样一个司机的边界模型之下,可以开发出一套优化算法,协同各个时空节点进行全局的运力调配,从而更好地解决供需失衡的问题。
(完)
雷锋网