9月22日,刚刚从德国慕尼黑车展归来的轻舟智航,就释放了一个重磅猛料——已获得数家头部车企的量产定点合作。此时,距离他们宣布战略转型,进军高阶智能驾驶前装量产,刚刚过去不到500天。
500天时间,轻舟从一家L4级的Robobus公司,成功转型成为一家高阶辅助驾驶供应商。基于地平线征程5的「轻舟乘风」高阶辅助驾驶方案,便是轻舟拿到的汽车智能化下半场的入场券。
2023是智能驾驶行业的一个转折点,既有BEV、Transformer等技术革新,又有城市NOA的量产落地。但对很多高阶智驾的供应商来说,2023也是生死存亡的一年。如果这一黄金的技术和商业窗口期没有抓住,想要再迎头赶上,难上加难。从智能驾驶的白热战中脱颖而出,既是如释重负,又是新的征程。
整个方案从无到有,再到最终获得定点,轻舟和地平线用500个日日夜夜,赢得了客户的认可,立下了行业的标杆。
2022年5月18日,在北京中关村某大厦的一个演播厅内,轻舟智航联合创始人、CEO于骞通过直播,对外公布了公司的“双擎战略”。于骞还和地平线创始人兼CEO余凯博士握手签约,双方达成战略合作关系,共同推进L2+级高阶智能驾驶前装量产。
在一些人眼中,从L4转型做L2+可谓“降维打击”。只需要在L4的技术架构基础上,做一些减法,砍掉几个功能就可以。但外行人眼中的“降维打击”,在内行人眼里,却是“处处受限”。
做L4级别的Robobus、Robotaxi,并没有严格的硬件资源限制,可以为追求极致的安全性和零接管体验,尽可能地进行全方位、无死角的堆料。
但是做L2+的前装量产,则需要周全平衡多种因素,不管是传感器的类型和数量,还是算力的成本和能耗,还有工程化难度和后续的支持服务等。
核心的目标,是让更多的消费者都能享受到高阶智驾的安全和便利。否则,如果量产的智驾功能只为高端车型服务,渗透率极低,就无法积累足够的数据进行算法迭代。技术得不到提升,更多的消费者便不会买单,也就无从形成商业闭环。
在如此激烈的竞争中,想要更快占领市场、抢占先机,就必须拿出更具规模化量产优势的方案。征程5,这颗全球唯二、国内首款量产级的百TOPS级高性能大算力车载智能驾驶芯片,成为轻舟面前最合适的选择。而且当时征程5已经有了定点和量产项目,这意味着基于征程5来做高阶智能驾驶方案的路径是可行的。
而轻舟和地平线之所以能够畅快地达成合作,最重要的原因,还在于双方理念的高度一致。比如,二者都认同不堆料的产品理念,也都坚持软硬结合的技术路径,因为只有软件+芯片的紧密耦合,才能做出真正给用户带来切实价值的产品方案。
当天,不管是于骞还是余凯,都用“一拍即合”来形容从此签约。
于骞甚至还喊出了“量产成本一万元高阶智驾方案”的目标,做极致性价比的城市NOA!同时,能够更快落地的高速NOA,也在轻舟的规划当中。
于骞认为,大部分人90%的试驾时间都是在城区,如果一个智驾系统只能在10%的高速场景里打开,对用户的价值并不突出。因此,轻舟从一开始就确立了城区+高速NOA多方案并行的产品策略。
“量产成本一万元”的口号立即引发了行业的热议。可在轻舟内部,不少员工却从未接触过基于国产芯片的智驾方案开发。其中就包括轻舟感知团队机器学习基础架构的负责人Maxwell。
当时,轻舟的感知方案在快速演进。在业界还在讨论前中后融合的路径差异时,轻舟就提出了“超融合”的感知方案,既能做到多传感器的时序融合,也能根据不同功能需要进行穿插融合,融合结果更优,还能避免各类误检和漏检。
在大模型概念还没有火爆出圈的去年,轻舟就已经在量产计算平台上,研发出了能够实现视觉、激光雷达和毫米波雷达特征和时序融合的大模型,以一个神经网络来实现视觉、激光雷达、毫米波雷达在BEV空间和图像空间上输出多任务结果,带来更高的感知精度、更好的适配性和更快的迭代速度。
虽然坐拥领先的技术架构,但要将其中的大量算法移植到征程5平台上,需要精细的算法选型和算法瘦身,挑战巨大。
紧迫的开发周期内,整个工作几乎没有试错空间。但是,没有量产项目经验,没有征程5的调试经验,算法选型和瘦身如何才能一步到位?
“在整个初期的开发工作中,地平线给我们分享了大量的量产算法经验,也在工具链的使用上提供了大量指导,让我们不仅能够快速搭建轻舟特色的智驾方案,也能更快实现征程5芯片的算法落地。”
比如,在做算法选型时,Maxwell发现,地平线的工具链并不只有简单的工具,还有丰富的最佳实践参考算法。这里包含了数百款算法模型的benchmark验证库,可以快速了解某个典型模型在征程芯片上的性能表现。“这些丰富的参考算法模型,可以大幅加快算法选型工作。”
算法瘦身则需要详尽的性能分析,在系统层面,需要精确到每个模块消耗的资源;在模型层面,需要知道每层网络的延迟和带宽占用情况。“这些都可以借助工具链做到,如此一来就可以快速找到算法瓶颈,对症下药,完成算法瘦身”。
最终,一些原先需要超过100 TOPS算力的模型,只需不到10 TOPS就能跑起来!
2022年7月,轻舟提出了一颗激光雷达城市NOA的理念,具象化地揭开了“量产成本一万元”城市NOA方案的实现思路。一颗激光雷达是最务实的方案选择,但关键就是要做到对其“物尽其用”。
在征程5上进行激光雷达算法部署时,Maxwell发现,激光雷达点云数据在喂给算法模型训练前,需要进行的一道复杂的前处理任务,只能在CPU上进行计算,成本很高。
考虑到激光雷达对于高阶智能驾驶的重要性,性能的问题绝对不能成为瓶颈。对此,双方团队相互走访,开展了多次面对面的技术交流。在地平线的指导和建议下,Maxwell团队快速进行了算法选型的调整,得以让该任务能够充分地利用征程5的BPU架构优势,使轻舟的激光雷达算法效能倍增。
很快,从独创的超感知融合方案,到后来被命名为OmniNet的大模型,都成功完成了在征程5平台上的适配,并顺利跑通了一颗激光雷达的城市NOA。从高架立交桥下路况恶劣的路口,到多车和大车混杂路况下的相互博弈,再到多层停车楼的清晰定位和连续过弯,表现都稳如老司机。
2022年11月,轻舟智航在首届技术工坊活动上,正式公布了“轻舟乘风”产品品牌。而紧随其后不到一个月的时间,又正式推出了基于征程5芯片的“轻舟乘风高阶辅助驾驶解决方案”,率先成为基于征程5芯片的“高速+城区”NOA辅助驾驶解决方案提供商。
也正是这短短半年的时间,轻舟智航的标签,就从单纯的L4 Robobus公司,变成了集“征程5+城市/高速NOA”于一体的话题性公司。“量产成本一万元”城市NOA的目标几乎得以实现,以视觉方案为主的高速NOA,也逐步定型。客户的目光,也被吸引而来。
随着功能开发逐步收敛,Maxwell的团队终于迎来了大考——给一个重要的客户做NOA的功能演示。
正值炎炎夏季,空气中没有一丝凉意。就在演示两天前,团队遭遇了最担心的“惊魂时刻”。平时测试正常的系统突发掉帧,导致决策性能变慢,驾驶体感变差。
Maxwell通过地平线的工具链进行性能分析后,发现演示车辆上所有模型的延迟,都远超位于苏州总部测试车辆的延迟水平。紧张的氛围瞬间笼罩了整个团队。Maxwell紧急联络地平线的系统工程师请求帮助,通过远程接入排查系统资源占用情况,很快将问题锁定在了团队此前没有关注过的层面上——DDR带宽占用异常,系统资源吃紧,致使各个模块帧率下降。
虽然找到了问题根源,但硬件调试却无从下手。正当束手无策时,地平线的工程师第一时间赶赴到了现场。
双方碰头发现,用于演示的车是辆新车,底层软件和推理引擎版本较低。在地平线工程师的支持下,Maxwell团队很快进行了一次软件升级。
然而,问题并没有彻底解决。模型侧的延迟虽然正常了,但丢帧问题依然存在。
双方团队就此尝试了很多方案,直到晚上仍没有答案。夜晚11点多,当Maxwell正准备暂时返回酒店休息时,发现地平线的工程师依然在思考问题根源。双方团队困意全无,再次投入其中,打算逐项排查演示车辆和苏州测试车辆的各项设置差异。
此时,距离给客户演示,只剩一天时间。
第二天一早,地平线的工程师赶赴现场继续排查。当检查到车辆log信息时,突然发现此前域控供应商的伙伴在debug时,打开了debug信息的flag,导致大量log信息产生。正是这些log信息,占用了大部分的DDR带宽资源。
当flag被关掉的一刹那,一切性能恢复了正常。整个团队悬着的心,终于落下。一道大关闯过,团队的信心也瞬间倍增。
“当时,地平线的同事真的是在车上一行一行敲代码,才查到问题所在。我们真的很震惊,仅仅一个开关,就把整个系统的问题全都解决了。”两天的协同作战,双方结下了“战友情”。
宣布推出基于征程5的“高速+城区”NOA后,轻舟小步快跑,持续完善和细分产品线,深挖征程5平台的潜力。
在刚刚过去的德国慕尼黑车展期间,轻舟的产品矩阵完整亮相,从Air、Pro到Max,依次对应基于单征程5、具备高速NOA+L2全功能的7V1R高速NOA方案;基于单征程5、可拓展城市NOA功能的11V5R高速NOA方案;基于双征程5、采用单激光雷达+11V5R的城市NOA方案。
从数千元量产成本的高速NOA,到万元级量产成本的城市NOA,几乎每一套方案,都做到了同类产品中更高的性价比。而在这背后,都能听到轻舟与地平线深度合作、联合调优的声音。
持续的软硬件优化,正是双方团队持之以恒的事。
“尤其是在量产阶段,我们会对每个细致、细小的模块,都会去做性能的极致优化。只有深入了解硬件底层的计算逻辑,做软硬结合的算法设计,才能够真正将软硬件效率发挥到极致。”
说到硬件,以前,Maxwell认为硬件强就是“大而全”——峰值算力大、支持算子数量多。但经历了一年多的开发,Maxwell也深刻认识到,硬件的有效利用率和算法效率,决定了芯片的真实性能。
“在智能驾驶领域,其实用不到太复杂的模型结构、混合精度、动态输入等特性。安全性、可靠性、鲁棒性、稳定性,以及算力的利用率和持续性,才是智驾芯片真正要解决的痛点。”
峰值算力是固定的,但在实际应用中,更能反映真实计算性能的FPS指标,是可以持续优化的。
一个最典型的例子,就是征程5在发布时,标称的是1283 FPS,而在一年后,通过软件架构的持续改善,已经达到了1531 FPS,到了今年上海车展期间,这个数字更是来到了1718 FPS,并且在运行典型分类模型和检测模型时的性能并不逊色英伟达Orin芯片。
Maxwell说,征程5是真正为智能驾驶应运而生的专用芯片。
“专用并不一定比通用简单,反而需要设计者对该领域有更为深刻的理解,知道究竟需要解决什么场景、什么问题。征程5的设计恰好吻合智能驾驶的应用需求。这种‘小而美’的专用设计,反而有其独特而精巧的艺术感。”
前不久,地平线官方宣布,征程芯片出货量增长至近400万片,其中征程5出货量突破了20万片,月度平均出货超过2万片。
可以预计的是,随着轻舟获得车企的定点,这套“小而美”芯片的出货量,还将持续增长。轻舟全新的基于视觉多任务模型的行泊一体BEV感知方案,也有望“上车”,在成本和产品体验上带来更多突破。
余凯博士此前曾说,“技术变革的时候,往往是快鱼吃慢鱼”。在整个智驾产业链中,地平线更灵活、更开放的开发环境,以及“草木繁荣”的生态力量,正是帮助轻舟这样的合作伙伴实现“快人一步”的坚实后盾。
在Maxwell眼里,轻舟和地平线的合作,不仅仅只是做出体验更优秀,稳定性、可靠性和适配性突出的方案,更是探索出了一条高阶智能驾驶更优、更快的量产落地路径。双方的深度合作,也被外界誉为“软件+芯片”协同创新的标杆和典范。
如今,双方第一个500天的奋斗历程已经结束。从获得定点来看,这是一个具有里程碑意义的节点,但在漫长的高阶智能驾驶普及的道路上,这也只是一个普通的中间站。站在中国智能汽车时代产业升级转型的黄金节点上,双方如何续写下一个500天的奇迹,拭目以待。
雷峰网(公众号:雷峰网)