上月中旬,一段自动驾驶雨夜路测视频吸引了业界目光。这段时长约4分钟的视频,是来自硅谷自动驾驶创业公司Drive.ai的路测首秀。视频中,自动驾驶车辆完满地完成了雨夜条件下的自主驾驶、避障、路口交通灯等待等一系列动作。雷锋网新智驾(AI-Drive)对其进行了第一时间报道。
在这之后,雷锋网通过Drive.ai组建之初的孵化机构负责人王笑,与这家硅谷创业公司取得了联系。2015年3月,Drive.ai拿到了团队组建后的第一笔投资孵化支持,而出资方正是Innospring。Innospring在硅谷创立的孵化器,是首个在硅谷成立的中美跨境基金和孵化机构,王笑任总经理一职。
王笑告诉雷锋网,Drive.ai早期的 8个联合创始人大部分来自斯坦福AI实验室,这个实验室出了很多业界大牛,包括最被人熟知的GoogleX创始人Sebastian Thrun和现在的百度首席科学家吴恩达。
两年前Drive.ai成立之初,Google已经积累了多年的自动驾驶研发经验,Drive.ai对Google此前的研发经验和教训做了总结,比如避免使用过于昂贵的激光雷达和高精度地图等,以及从一开始就采用深度学习的策略。
雷锋网新智驾(AI-Drive)在此前的报道中也曾提到,相对于使用高精度昂贵传感器的方案,Drive.ai更倾向于通过“深度学习”解决这个问题,这似乎是Drive.ai规避谷歌技术方案弯路并搭建门槛的途径之一。
据雷锋网了解,Drive.ai的目标,在于研发一辆用低配雷达、廉价摄像头、Google 2D Map就能上路的无人驾驶车,并用深度学习解决成本、认知准确性以及商业模式可行性三个息息相关相互牵制的问题。那么,Drive.ai的团队怎样实现这样的初心呢?远隔大洋,雷锋网新智驾对Drive.ai团队进行了采访,团队联合创始人之一Tao Wang解答了我们的疑问。
*Drive.ai联合创始人,右一:Tao Wang
雷锋网新智驾:相比于高精度地图和昂贵的激光雷达(LiDAR),Drive.ai更多强调使用摄像头和廉价的传感器来实现自动驾驶解决方案,为什么,这是否会导致整套方案在图像计算方面有很高的负载?
Tao Wang:首先,我们的技术研发目标在于“安全”。其中很重要的一点就在于传感器的冗余设计:我们不会任何一种单一的传感器。同时,我们也意识到了激光雷达的高成本以及实时更新的高精度地图的不可靠性。因此,我们希望研发一种软件系统,它可以基于许多常见的传感器,包括摄像头、激光雷达、雷达等进行运算处理,以此来达到更好的可靠性和扩展性。
我们的软件核心在于“深度学习”,深度学习的算法十分灵活,而且已经成功应用在许多领域,如计算机视觉、语音识别、自然语言处理等。我们的深度学习算法允许我们从各种不同的传感器中整合信息,避免单个噪点导致的误判。在成本控制上,我们使用市面上的普通传感器,整个自动驾驶生态的硬件价格下降已经成为趋势。同时,我们把更多精力放在软件适应性的研发上,而不是硬件的定制上,我们也省下了不少一次性投入,并具有更敏捷的开发周期。
关于计算单元的负载问题,Drive.ai团队善于优化实时应用场景下的深度学习算法。我们的车内运算单元的功率,几乎接近台式机的水平。我们还将深度神经网络实时运行在车规级的嵌入式硬件中,这一硬件来源于与Drive.ai合作的OEM厂商之一。
雷锋网新智驾:我们知道,诸如谷歌、特斯拉等公司已经积累了数年的自动驾驶测试数据。在这种情况下,Drive.ai如何加速机器训练的进程并实现赶超呢?
Tao Wang:训练一辆汽车,就如同训练一个人,它并非由纯粹的小时数或行驶里程决定的。而是需要在正确的算法框架中灌输正确的数据和知识。
我们的多传感器套件能够收集丰富的场景数据,而这在机器学习中,要比海量的、千万亿字节的驾驶视频更有价值,因为视频占用的空间极大但蕴含的增量信息却很少。
所以,我们针对性地开发了半自动化的数据标记工具,帮助我们进行高质量的数据分类,分类速度能够比一些同类竞争者快20倍。同时,我们也使用室内模拟器收集边界状态的数据,并在模拟环境中验证算法。最重要的一点是,我们的系统基于深度学习研发,目前这种解决方案已经被证实能够随着训练数据的增加而持续提高性能,而不会在吸收了一定量级数据后遭遇天花板。
雷锋网新智驾:“人机交互”,是 Drive.ai 要解决的重要问题之一。如何训练机器理解路人以及人类驾驶员的行为?
Tao Wang:人机交互(Human-robot interaction ,HRI),与Drive.ai测试车辆的其他功能一样,都是由我们的深度学习算法支撑。我们的研发目标,是训练自动驾驶车辆同时理解车内和车外环境,并使它们与周围环境进行恰当的交流。
雷锋网新智驾:在路测过程中,如何处理好测试车与人类驾驶汽车之间的关系?
Tao Wang:我们在自动驾驶汽车研发中遇到的最大的挑战,就是公众信任和与公众意图的交流。在更高水平的自动驾驶方案中,我们的系统会尝试通过传感器数据预测人类驾驶员的意图,并使用视觉和音频手段与他们交互。例如,在一个十字路等候时,当其他车辆有优先的路权时,它可以通过可视化或音频手段提示其他司机先走。反之,我们会告知其他司机我们准备起步了。
雷锋网新智驾:之前的报道中曾提到,谷歌的自动驾驶团队曾经走过一些弯路,例如过分依赖激光雷达和高精度地图,并采用非深度学习的解决方案,这会造成什么影响?Drive.ai从中获得了哪些启示?
Tao Wang:谷歌的自动驾驶汽车技术起源于DARPA (美国国防部先进研究项目局) 超级挑战赛。深度学习在那时还没有发展到这样完备,所以他们采取的是一种传统的机器人手段。从那时起,他们基于这种解决方案创造了显著的成果,而且也拥有世界上最复杂的自动驾驶系统之一。
但我们的团队,是以深度学习为先的。这意味着我们所有的底层架构都要围绕深度学习设计和建立。我们坚信,深度学习会成为最适合自动驾驶汽车实现的技术路径,而目前为止业内对深度学习的应用还只是皮毛。我们的团队中包括了世界顶级的一些深度学习算法专家,我们相信所做的努力对未来交通而言是非常重要的。
雷锋网新智驾:Drive.ai团队目前有多少辆测试车?
Tao Wang:我们有多个自动驾驶汽车平台,用于收集多个激光雷达、摄像头以及其他传感器数据。传感器会将信息传递给软件系统的人工智能神经网络,这些神经网络系统在普通计算硬件单元上运行。
雷锋网新智驾:Drive.ai是否与OEM厂商达成合作,进度如何?
Tao Wang:我们目前与一些OEM厂商和其他行业伙伴签署了战略合作,这些计划会同步推进。
雷锋网新智驾:从最开始,Drive.ai就将研发目标定在Level 4或是Level 5级的自动驾驶系统。但同时,我们看到你们正加速商业化进程。这是否矛盾,如何取得一个平衡?
Tao Wang:目前,我们的测试车辆已经实现了Level 4级别的自动驾驶。随着技术发展,我们会继续研发Level 5自动驾驶系统。商业化方面,我们的直接焦点,仍在于帮助商业车队研发自动驾驶软硬套件方案。