雷锋网新智驾按:9月14日,在第四届APEC车联网研讨会暨MMC智慧出行体验周上,雷锋网新智驾联合MMC共同举办了主题为《智能驾驶的商业化初探》的沙龙。本文是此次沙龙上,极奥科技创始人王雪坤的分享。
在创办极奥科技之前,王雪坤是四维图新的产品总监,在地图行业有超过10年的经验。在四维图新期间,他主导了导航产品FunDrive和车联网产品WeDrive的开发,同时还曾负责宝马、沃尔沃、马自达等车企的项目工作。
极奥科技创办近2年,它的核心业务是一个数据众包平台。通过“吃进”各种不同车载设备、传感器上原本零散数据,极奥通过平台消化梳理形成高精度、高鲜度的格网地图,王雪坤他们则希望用高鲜度的数据和算法助力主机厂、Tier 1和新技术公司的智能驾驶开发。
极奥科技创始人王雪坤
近年激光雷达和影像识别技术都趋于成熟,自动驾驶行业内的竞争已经走到了算法这个层面。自动驾驶是一个很长的产业链,大家也都在寻找自己的位置。我们极奥在这里做的,其实是在很长一段时间不被重视的工作:众包地图。
在高精度地图这个领域,现在已经有很多大公司花了重金,使用全副武装的测绘车开始很多测绘的工作。这些测绘车都非常酷,这些工作本身也很有意义。因为车道级的拓扑路网以及厘米级精度的地图,都是自动驾驶的决策算法所必须的。厘米级精度的地图可以为自动驾驶决策算法提供很好的支撑。但如果考虑到地图一个非常基本关键的问题——地图的鲜度怎么保证,就是地图的更新频次,这里面涉及到巨大的成本。每一个车道的变化一定会影响用户开车的情况,一个车道不通了,在车道网络中对应的整个模型结构就错了,就会影响到自动驾驶汽车。所以想到解决这个问题就想到了众包,我们也是从众包开始入手。
我们说一下现在数据的情况:目前我们平台上有450万辆车,是从后市场硬件切入。我们众包了450万辆车的数据,大家能想到的设备我们都有——行车记录仪、OBD、车机等等,目前这些车辆的日活在60%以上。从今年6月11日开始,每天稳定的提供1亿公里的相关数据。
既然我们是众包,我们现在是“口不择食”,所有的数据我们都要。我们收集的数据以轨迹数据为基础,在根据众包的设备上不同的传感器形成了不同的轨迹附加属性:如果这个设备上有摄像头,那通过我们植入的算法利用设备的剩余算力完成对车道线、交通标志、红绿灯等识别后,上传识别结果;如果这个设备是一个OBD或者后市场的那种破解CAN的产品,我们就可以拿到车内其他传感器的数据。
举个例子,我们一开始希望通过加速度传感器G-sensor做道路曲率的检测,后来我们发现一些行车记录仪等设备的加速度传感器太烂了。但我们发现它有别的用处,我们就把它用在记录道路的颠簸和损毁状态。还有我们接入了车载空气净化器的数据,所以我们拥有道路上每一段PM2.5的数据。这是关于我们平台上,目前什么数据都要。
既然平台是基于地理数据为基础,我们第一步肯定要做自己的路网。这里面也有一些很好玩的事:上个月我跟某一家图商有交流,给他们看格网的数据,当时他们指出来某一条车道线做错了,这条车道不能做左转。那我就去看原始数据,原始数据上的确有大量的左转数据。然后我们又去现场勘测,发现这个车道一个多星期前刚刚从直行车道变成了直行加左转车道。
目前,从我们的经验来看,一个类似上海这样的城市在积累了20万辆车,连续六个月以上的数据之后,就可以开始制作第一版地图。在第一版地图制作完成之后,类似于上海中环这样的道路,我们可以通过2000车次轨迹形成亚米级的道路形状点,5000车次轨迹完成拓扑关系的挂接,道路的新改增以及交通规制的变化可以实现小时级更新。
不过事情都是在变化的,当我们把关注点从轨迹数据处理转移到视频数据的处理之后,这才真正地打开一片新的天地。通过视频数据处理,我们补充了轨迹无法提供的交通标牌,交通标志,红路灯等静态属性之外,还大大降低了之前使用纯轨迹方式构建车道模型的运算复杂度。除了静态模式识别的内容外,极奥和所有视觉分析公司一样,完成了车辆类型的识别,车牌的识别,行人分析以及交通场景语义的分析等等。但是,我们不同的是,我们没有把这些技术用在实时感知上,而是让这些分析结果全部沉淀在了经纬度上,沉淀在了拓扑路网上,沉淀在了每一个格网里。
这样就形成了我们概念中的众包地图。设施层为基础,这里面包含的是基础的车道级拓扑网络、相关的设施属性等等,从拓扑模型和数据精度上与大家一直说的HAD MAP或者HD MAP保持一致。
但在此之上,我们通过众包的视频数据、车内其他传感器数据等等形成了环境层和行为层。这两层数据不但与位置相关还与时间紧密相关。比如这条路上什么时间集卡会大量通过,这个路口在什么时间行人闯红灯密集,甚至包括这个路段在春天几点会点亮有路灯,冬天路灯会在几点熄灭等等。简单的说环境层中沉淀的是每条路在不同的季节,不同的时间的变化情况。然而行为层中我们的关注点又回到的驾驶的层面,每条路上车辆通常的驾驶情况和周边车辆的驾驶情况。简单的说,行为层沉淀了老司机的驾驶经验,按时髦的说法就是自动驾驶的训练数据。
但是这些数据怎么用呢?我举个例子。这是自车和前后的A、B、C三部车,我们需要在C车TTC=3秒的时候给出一个预判,C车会不会加塞。明显这是一个L2的功能。这件事我们考虑的出发点不是如何构建一个实时高效的运算模型,而是考虑到不同道路在不同的时间里加塞预判要使用不同的模型。在研发的过程中,我们通过掌握的众包数据先建立了一个通用模型,再通过这个模型训练了每条道路上在不同时间点上的模型。最后再根据位置和时间,加上通过摄像头的测距,再代入到相应的模型中,形成了最终的预判结果。目前我们实现的对C车的加塞预判准确性在70%左右。在复盘数据后,我们发现很多预判错误的场景中,所有的数据完全符合这个模型,但是就是没有发生加塞行为。怎么解决?当然我们的数学模型还是有待提高的。可是,让我们再从人开车的角度思考,当我们从反光镜里面看到后车的时候,不但考虑的是这辆车现在的驾驶行为,我们也会对这辆车本身有个判断。我们脑子中会有一个预判,开法拉利的人就爱飙车,我要躲着他一点。因此,我们把这种思考方式同样教给了环境层和行为层。
我们使用刚才提到的车型识别和车牌识别的技术,针对不在我众包平台上的车辆建立了类似于人物画像的标签,也就类似我们自己对周边的环境形成一个概念性的认识。所不同的是,我们让在众包平台上的所有车辆一起来补充这个标签,提高这个标签的准确性,也就是把所有人的概念认识形成了通用的观念。之后,我们在对周边车辆预判中除了从纯数学的角度考虑外,就加入了对车本身的行为参考。当然这件事会更难,更复杂,但是价值更大。
众包的魅力除了能沉淀老司机经验外,更大的魅力是快速的发现这个世界的变化。当我们把视频分析结果,在于拓扑路网相结合之后,就有了更多的火花。再举一个例子:大家都知道现在的动态交通信息是通过对浮动车数据的处理形成的,最终以红、黄、绿线的形式表示出来。但是这种动态交通信息最大的弊病除了表达不精确外,就是只有在道路真的堵上了它才能反馈出来。现实中,当我们已龟速通过堵车的结点时会发现无外乎前面有交通事故,无外乎四个车道被封闭了两个做路面维修,无外乎路面上有一块石头大家都在躲着开车等等。这些非正常的道路状况其实早有车发现,只是后车不知道而已。
我们可以对道路施工做到自动发现,自动上报的。同时在拓扑层面上,也是可以及时地做到车道级的调整,并且把相关的数据再分发给其他车辆,以便后车提早绕行。目前我们完成了对锥桶、施工标志、水马等固定物体的分析,在这个产品中我们也会逐步加入非正常行人,施工车辆,车道非正常停车,交通事故以及路面遗撒等情况的分析。
自动驾驶无论是路线选择或者车道决策中对地图的需求是不可避免的。然而,除了地图数据本身的精度外,地图的鲜度也是非常重要的。同时环境层和行为层数据更为自动驾驶决策提供了必不可少的数据支持,众包数据、众包制图的意义和价值也就来源于此。
雷锋网推荐阅读:《前特斯拉工程师创办高精度地图公司lvl5,要用手机摄像头众包制图》