在智能驾驶领域,毫末智行也已经成为不可忽视的重要参与者。
两年前,毫末就开始布局“重感知”路线,是国内重感知路线的首提者。现在小鹏、华为、理想等企业也开始转向重感知,智能驾驶大规模进城的时间线又往前拉近了很多。
4月11日的第八届毫末AI DAY上,毫末发布了业内首个自动驾驶生成式大模型毫末DriveGPT 雪湖·海若。
这也让毫末智行在上海车展期间多次被提及和讨论。
随着ChatGPT火爆全网,它所采用的Transformer大模型以及“人类反馈强化学习(RLHF)”技术再次引发行业关注。在自动驾驶领域,毫末在国内最早将Transformer大模型引入到数据智能体系MANA当中。在2023年1月的HAOMO AI DAY上,毫末智行CEO顾维灏介绍,毫末推出的人驾自监督认知大模型就已借鉴了ChatGPT的实现思路,采用RLHF(人类反馈强化学习)技术,通过引入真实人驾接管数据,对自动驾驶认知决策模型进行持续优化。
毫末的认知决策算法经历了三个阶段的进化。第一阶段是引入个别场景的端到端模仿学习,直接拟合人驾行为。第二阶段是通过认知大模型,引入海量正常人驾数据,通过Prompt的方式实现认知决策的可控、可解释。第三阶段,也就是当前阶段,通过引入真实接管数据,并且在大模型中开始尝试使用RLHF算法,对人驾接管数据进行学习。为此,毫末构建了一个包含“旧策略、接管策略、人工label策略”的Pairwise排序模型。基于这一排序模型,毫末构建了自动驾驶决策的奖励模型(reward model),从而在各种规划场景情况下做出最优的决策。通过这一大模型,在掉头、环岛等公认的困难场景中,场景通过率提升30%以上。
据悉,雪湖·海若通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化,现阶段主要用于解决自动驾驶的认知决策问题,终极目标是实现端到端自动驾驶。到2023年4月,MANA学习时长超56万小时,相当于人类司机6.8万年。毫末DriveGPT雪湖·海若,已经完成基于4000万公里驾驶数据的训练,参数规模达1200亿。
毫末发布会当日还公布了一个颇为重要的信息:雪湖·海若的能力对行业来说是开放的。目前,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等多家企业和机构已经加入。
在本次上海车展的魏牌、坦克展台,备受关注的魏牌大六座舒适电动SUV蓝山DHT-PHEV,是首个全系标配毫末HPilot的车型。即将量产上市的新摩卡DHT-PHEV,将是首个搭载雪湖·海若的车型。在DriveGPT的加持下,毫末重感知的城市导航辅助驾驶NOH将会有一次质的飞跃。自动驾驶技术发展到现在,硬件性能早已不是天花板,关键是自动驾驶感知决策能力以及数据样本的量级。ChatGPT的成功表明,大模型可能才是行业最终的解决方案。雪湖·海若的发布只是一个开始,接下来大模型在自动驾驶领域的应用规模会更大。
随着城市导航辅助驾驶技术的不断成熟,2023年将是城市NOA在市场上大展拳脚的关键时刻。各大厂商都在推出自己的重感知方案,力求在城市道路上实现智能驾驶的突破。高性能、低成本是未来全场景辅助驾驶量产落地的关键,从这个维度来衡量,毫末所面对的市场竞争不小,让我们拭目以待。
雷峰网(公众号:雷峰网)雷峰网雷峰网