今年9月,在北京顺义的一条开放道路上,顾维灏穿着豪末蓝色工服骑着一辆粉色小电驴,紧紧跟在无人配送车小魔驼屁股后边。
当天下午,因为要出席顺义智能网联汽车大会,身为CEO的顾维灏又要脱下工服,换上正装。跑到现场当“监工”做测试,是顾维灏这些年在自动驾驶行业养成的习惯。
毫末成立以来,他和毫末董事长张凯一有时间就会亲自上阵,跑乘用车辅助驾驶产品和无人配送车路测。
过去一年,毫末一共打了四场仗,内部称之为“智能驾驶装机量王者之战”、“城市NOH百城大战”、“末端物流自动配送商业之战”和“MANA大模型巅峰之战”。在这四场仗中,毫末面临着乘用车拓展新客户、“卷”千元级别高阶辅助驾驶产品、城市NOH高速推进、DriveGPT加速落地车端和云端的高压和挑战。“一打开工作平台,就有几十条消息扑面而来”。有很长一段时间,作为毫末的产品市场副总裁,蔡娜的大部分时间都花在了和客户各部门拉齐需求上,毕竟“需要什么样的产品是客户来决定的”。蔡娜把每次靠打仗来解决困难的方式形容为“撕裂式生长”,虽然有种肌肉被撕裂的疼痛感,但成长的速度远比对手们要快。在今年10月的毫末AI DAY的前后,我们与毫末智行CEO顾维灏及内部的产品、技术部门的成员进行了对话,试图从不同的业务单元,梳理毫末智行在过去一段时间里的曲折、成绩及未来规划。
如果非要从过去的一年里,挑一件让顾维灏最操心的事,一定是城市NOH。
他撂下了这么一句话:“明年(2024年)第一季度,城市NOH会规模落地。只有进入战场,上了牌桌,我们才有打牌的权利。”
乘用车辅助驾驶产品一直是毫末三大业务版块中,最被寄予厚望的那一个。
原本,毫末的城市NOH将率先搭载在长城的魏牌新摩卡上,等到2022年年中新车型发布后立即随车交付。
不出意外的话,毫末会和小鹏、华为一起,成为国内第一批大规模落地城市领航辅助驾驶的玩家。
早在今年年初时,毫末准备的软件已经封板。但魏牌新摩卡的上市时间延后,毫末“进城”的计划也只能往后挪一挪。
在等待的过程中,毫末并没有停下。而是在暗自蓄力一年后,一口气发布了3款千元级别的NOH产品:HP170、 HP370 和HP570。
2022年第四季度,毫末董事长张凯、CEO顾维灏和产品负责人牵头开了一次产品规划会。以往,每周的例行的产品规划会,大多数话题都围绕着市场、客户和竞品以及自家产品的竞争力分析。
但在这一次产品规划会上,他们做了一个很大胆的决策:立即投入千元级别第二代产品的研发。
此时,业内的方案基本都是万元级别。因为光是一颗激光雷达成本就高达4000-5000元。想要压缩成本,必须放弃部分单价很高的硬件,比如激光雷达。
不过,这不是毫末第一次做如此大胆的决策。早在2021年,城市NOH立项时,毫末就坚决地选择了不依赖高精度地图,走重感知、轻地图的路线。
回过头来看,这个决策既大胆又不大胆。
大胆在于,毫末需要克服研发部门对高精度地图的依赖。在毫末的多位产研成员看来,有时最难的不是技术的突破,而是摆脱心理依赖。
不大胆在于,不依赖高精度地图这条路不算真正意义上的创新,毕竟已经有坚持纯感知路线的特斯拉在先。
但在外界看来,毫末的举动毫无疑问是大胆的,是国内最早一批坚定地走的“重感知、轻地图”的玩家。
到了2022年,越来越多的玩家跳出来,喊出“去高精度地图”的口号。紧接着,无图方案大行其道。从结果来看,毫末似乎又一次走在了同行的前面。
那么,毫末千元级别的方案是否会再一次成为行业主流?
毫末的三款新产品中,HP 170对应的是售价为3000元级的高速无图NOH;HP 370对应的是售价为5000元级,具备城市记忆行车+记忆泊车功能的产品;HP570对应的是售价为8000元级的城市全场景无图NOH。
在这三个方案中,激光雷达都不是必选项。而在最具备性价比的高速无图NOH方案中,客户甚至可以放弃选配前雷达和前角雷达。
雷峰网了解到,对于大多数B端的技术服务商来说,今年既是卷“进城”的元年,也是卷“行泊一体”的元年,更是卷“进城”价格战的一年。
前有大疆,在今年4月发布了一个千元级别的新一代智能驾驶系统方案,该方案的基础配置只用了7个摄像头。大疆号称能在32TOPS的算力下,实现高速领航辅助驾驶和记忆泊车、行车功能。
现在又有了毫末的HP170,仅凭借5 TOPS算力,就可以实现行泊一体的智驾功能。并且,该方案的价格仅为3000元级。所以,毫末董事长张凯才敢在今年10月的AI DAY上断言:“更具性价比的行泊一体的域控方案将成为主流”。
过去一年,在末端物流自动配送这个领域,毫末两件事扩大了自己的市场边界:第一件事是和达达的合作,另一场仗是“把产品的价格打到10万元以下”。
蔡娜总结到,“毫末是全球首个L4业务实现末端物流自动配送盈亏平衡的公司,能在盈亏上打平,新的合作模式功不可没。”
毫末和达达两边的高管很早就建立起了联系,也在线下聊过一次,但当时没有找到契合点。直到去年有一次见面时,双方高管聊到了末端物流自动配送整体的综合效率、成本这些问题,才决定展开合作。
在末端物流自动配送领域,如果由毫末这样的服务商来打通商品上货、运输、送货上门的每个环节,会让运营费用变得很高。
但毫末和达达合作不太一样,蔡娜表示:“我们负责中间的自动驾驶送货,这是无人车最擅长的。上货和送上门都是达达通过自己的运营来解决。这样一来,整个链路的成本更低,我们在经济上也能承受。”
相当于毫末服务于达达的“履约”场景,为达达提供从A点到B点的运输能力。而“履约”恰恰是毫末最擅长的领域。用一组数据就足以证明:截至今年9月,小魔驼已经配送超过22万单。
因此,对毫末和达达来说,这是各自做自己最擅长的事。
在末端物流自动配送这个战场上,毫末再次用了把产品价格打下来,给对手狠狠一击的作战方式。和乘用车产品一样,毫末的末端无人物流车之所以备受关注,也是因为“性价比”。
今年4月,毫末发布了售价89999元的小魔驼3.0,这是国内首款9万元内中型末端物流自动配送车。
这两年来,如何把末端物流自动配送车的价格打到10万元以下,是所有玩家必须突破的关隘。而最大的难点在于,末端物流自动配送车的生产成本高。
一位业内人士表示,在这个领域做得比较好的玩家,一年投入“小车”的保有量大概是2000台。
“小车”没有完备的供应链,几乎都是靠乘用车制造商代工。对于一条产线至少能生产10万辆的制造商来说,“2000台”压根不配称为“有量”。
乘用车“有量”走的是批发价,“小车”没有量就要走“零售”的价格。
这也是为什么在末端物流自动配送领域,好几家头部公司都被困在了“如何把小车的价格打到10万以下”的难题里。
小魔驼的价格能降到9万元以内,最主要的原因是毫末在硬件和软件上都做到了“复用”。毫末智行作为国内乘用车辅助驾驶的头部玩家,有强大的量产自动驾驶能力,让末端物流自动配送车的成本更加可控。
比如小魔驼的硬件复用乘用车的配置,软件方面则是把乘用车L4的技术下放到了小魔驼,同时乘用车研发团队也经常派人支援小魔驼的研发团队,两边团队互通有无,没有所谓的部门墙。
如毫末董事长张凯在发布小魔驼3.0所言,“伴随着自动配送车成本降到9万元之内,末端配送市场将有机会迎来大规模部署,无人配送车赛道的第一梯队玩家也会变得清晰起来,毫末具备先发优势。”
末端物流配送远没有饱和,仍然存在很大的增长空间,而运力短缺、人力成本的增高是无法避免的挑战。末端物流自动配送车可以说是填补运力短板的最佳载体。
一旦解决末端物流配送车领域成本高、投入与产出不成正比的问题,规模化盈利的愿景就能有望实现,毫末的示范依旧在证明这一应用的落地前景。
顾维灏认为,自动驾驶的进化划分为3个时代,1.0时代是硬件驱动,2.0时代是软件驱动,3.0时代是数据驱动。
具体而言,与2.0时代相比,自动驾驶3.0时代的开发模式和技术框架都将发生颠覆性的变革。在自动驾驶2.0时代,以小数据、小模型为特征,以Case任务驱动为开发模式。而自动驾驶3.0时代,以大数据、大模型为特征,以数据驱动为开发模式。
从团队成立初期开始,顾维灏便反复强调“要坚持把海量的数据用起来,发挥更大的效果”。毫末在数据积累方面有着其他玩家难以企及的优势,在乘用车方面,毫末依托长城这一大客户,积累了超过9000万公里的用户里程数据。
如何充分挖掘数据的价值,并且用于自动驾驶系统的训练,是研发团队面临的最大难题。
大约两年前,“大模型”被锁定为技术研发的大方向。为此,毫末内部成立了一个几十人的小团队,专门负责大模型的研发。
过去的200多天里,毫末通过AI DAY陆续向外界透露了其在大模型研发方面的诸多进展。其中,最受瞩目的是今年4月,毫末在其第八届AI DAY上发布了DriveGPT 雪湖·海若。
这是行业内首个自动驾驶生成式大模型 。
我们可以把DriveGPT简单理解为,由感知大模型和认知大模型两个部分构成。
毫末先是在原本的视觉自监督大模型的基础上,搭建了如今的感知大模型。并且,这一届AI DAY上,毫末又在DriveGPT里引入了多模态大模型和语言大模型。
当把感知、导航、驾驶的结果和过程同时到输入认知大模型后,就能形成驾驶语言。驾驶语言能够和基础大语言模型做交互,给出更符合人类认知的驾驶策略和驾驶解释,最终实现操控车辆的行驶。
DriveGPT 发布后立即受到了业内人士的关注,可同时也有人质疑毫末只是单纯地蹭ChatGPT的热度。
毫末技术总监潘兴否认了这些质疑声,他表示:“投入大模型研发本身是一个系统性的事情。”早在两年前,他就带领团队提前部署大模型的工程、训练和管线等工作。
2021年底,毫末发布了自动驾驶数据智能体系 MANA(雪湖)。2022年底,为了发布大模型做准备,毫末建成了当时行业内最大的智算中心,每秒浮点运算达到67亿亿次。随后,包括理想、蔚来、吉利等车企纷纷宣布了落地智算中心的消息。
在大模型的训练方式方面,毫末也做了很多改变。从最早利用CNN,再到在感知系统里引入transformer,把自然语言的训练方法放到图片上应用。
后来,毫末又用视频流的方式让AI 系统学习人类司机的驾驶行为,把车上多个摄像头获取的图像拼到一块儿,使它变成一个10秒或者15秒的片段(Clip)。再通过视频自监督方式,让4D Clip标注实现100%自动化,人工标注成本降低98%。
不过,毫末在大模型的研发上最大的优势是什么?
顾维灏的回答是:第一,智算中心的基础建设;第二,有足够多,且鲜活的数据。
他很庆幸去年做了这一个这样的决策:“2022年底我们落地智算中心时,锁定了几千张卡。那个时候ChatGPT还没有发布,又过了半年ChatGPT才出现,GPU芯片疯狂涨价,根本买不到。”
前文提到了毫末在数据方面的优势。而顾维灏之所以很重视如何把数据活用起来,是因为他过往曾投身于视频、语音等多个领域的AI产品研发,明白数据积累、有一套完备的数据智能体系有多重要。
“ChatGPT出来之后,过去几个月出现了各种各样的大模型的公司,也很快地挂掉了一批大模型的公司。像Meta、微软这样的大厂靠大语言模型(LLM)积累了很多数据。其他的创业公司既没有足够多的用户,产生足够多的数据,也不会把数据灵活转起来。即使采用了强化学习、增强学习的方法,也很难形成回流。这样的公司完全没有竞争力。”
在顾维灏看来,未来的自动驾驶系统一定是跟人类驾驶员一样,不但具备对三维空间的精确感知测量能力,而且能够像人类一样理解万物之间的联系、事件发生的逻辑和背后的常识,并且能基于这些人类社会的经验来做出更好的驾驶策略,真正实现完全无人驾驶。
据顾维灏透露,DriveGPT的云端能力已经对外开放,合作伙伴可以通过使用API、模型的专项优化、服务的私有化部署,与毫末合作。DriveGPT发布200天左右的时间里,累积480万段Clips高质量测试。目前已有生态伙伴17家,助力生态伙伴提效90%。
此外,2023年DriveGPT成功入选“北京市通用人工智能产业创新伙伴计划”成为首批模型伙伴观察员及入选北京市首批人工智能10个行业大模型应用案例。
在自动驾驶行业,AI Day或者科技日通常被视为一家公司最重要的年度营销事件,一般一年只有一次。
毫末这几年出圈,HAOMO AI DAY功不可没。以至于有些业内人士调侃毫末是一家“AI DAY敢开得比特斯拉还频繁的公司”。
当被问及“开AI DAY如此频繁”这个问题,顾维灏没有回避,只是笑着说道:“当然是有需求,一是为了招人,二是希望打造一个AI技术交流平台”。
准确来说,顾维灏是在创业第一年的一次招聘受挫后,才真正意识到“营销”对于一家初创公司有多么重要。
疫情期间,顾维灏曾经开过一次很尴尬的线上招聘会,当时只有几个人在线。他富有激情地介绍了一遍毫末,快结束时却有人提问“毫末到底是干什么的?”
那一瞬间,顾维灏才明白,想要成为别人的选择,首先得主动创造机会让别人知道“你是谁”。
很快,毫末调整了AI DAY的方向——交流和发布全球领先的自动驾驶AI技术成果。这几年行业听到的transformer、BEV+transformer、重感知、轻地图、自动驾驶3.0时代、大模型等,都是风起HAOMO AI DAY。
此外,AI DAY还请来了行业大咖参加圆桌讨论,计算机院士张亚勤、前阿里大模型研发负责人贾扬清等人都曾到场。
顾维灏坦言:“过去投资人也总问我毫末和友商有什么区别。最近他们也问的少了,有人来问我,我就说你看我们前几届AI DAY讲的内容,拿这些内容去问问别的公司,他们对这些问题的实践是什么样,有没有我们公司做得好。”
长期关注自动驾驶行业的投资人老彬正是通过毫末AI DAY关注到这家公司的。
他还记得自己第一次对毫末产生兴趣是其宣布在自动驾驶系统里引入Transformer,“当时我很好奇,毫末到底有什么实力,敢于和特斯拉一样用这个训练方法。”
2018年后,国内自动驾驶行业鲜少有新入场的玩家。后来的故事是,L4级自动驾驶技术公司大多困在了产品难以量产落地的窘境里。毫末虽是新晋玩家,却因为从L2级自动驾驶产品做起,步子迈得更稳。
老彬很是感慨:“毫末赶上了一个好时候。”
诚然,如果把目光聚焦在2022年-2023年,自动驾驶行业遇上了大模型浪潮,小鹏、问界等车企“卷”智能化得到了超预期的回报,新车型销量显著提升。投资人对自动驾驶行业的态度也因此从冷淡变得再度热切,毫末借助这阵东风,扶摇直上。
现在,毫末内部已经确定了未来一年要打的仗,概括起来是:城市NOH大规模落地和拓展新客户、推出极致性价比的无人物流配送车产品、DriveGPT商业化。
城市NOH是接下来极为重要的一仗。尽管长城仍是毫末最大的客户,但毫末从未放弃过走出去,拓展新的客户。
在投资者们眼中,自动驾驶技术方案相对成熟后,B端技术服务商的日子就会好过起来。尤其是B端的公司把成本打下来后,主机厂或者车企们自然会从高投入的自研抽身,投向供应商们的怀抱。
但对于大多数B端自动驾驶技术供应商来说,自动驾驶行业还没有真正走向成熟。
顾维灏向雷峰网(公众号:雷峰网)表示,车企选择合作伙伴向来非常谨慎。因为一个量产项目,仅是挑选供应商就需要一年时间。车企从选定供应商到正式投入量产后又得花一年多的时间。量产车型上市后,技术供应商还需要服务车企三年左右。
“所以车企在选择合作伙伴的时候,都会去评价一家技术服务商到底能不能活过五年。”在顾维灏看来,毫末是业内相对年轻的公司,车企的考量自然也就会多一点。
但他很自信:“我们很快就会破局。”