[ 行业] 日前,第六届HAOMO AI DAY正式举办。据悉,HAOMO AI DAY品牌日系列活动始于2021年,以季度为周期召开,用于展示当下自动驾驶领域最新趋势以及毫末智行最新发展动向。

  在活动中,毫末智行董事长张凯分享了当下智能驾驶领域的发展趋势。根据该企业提供的数据,2022年,中国市场在全球智能汽车份额中所占比例已达到57%,渗透率达到26%。相比之下,欧洲所占比例为27%;美国所占比例为10%。中国市场已呈现绝对领跑之势。


  而从国内数据来看,2020年-2022年6月,是中国市场各品牌高级别辅助驾驶功能搭载的快速攀升时段,尤其是2022年上半年,高级别辅助驾驶的前装搭载率达到26.64%。据张凯预测,上述数据还将快速增长,预计到2025年,中国高级别辅助驾驶搭载率超过70%。

  市场繁荣可期,但竞争也愈发激烈。一直以来,自动驾驶领域中都有着“渐进式”与“跃进式”两种发展策略。所谓“渐进式”策略,指的是优先量产L2级辅助驾驶、高级辅助驾驶,并由此低成本地获取数据,不断完善、迭代算法,最终做到L4、L5级别的自动驾驶。

  “跃进式”策略指跳过L2、L3,直接一步到位做到L4、L5级别自动驾驶。选择跃进式策略的大都以科技公司为主,比如谷歌旗下的Waymo,毕竟在不造车的前提下,这些科技公司也难以找到大规模量产车为其提供数据。


  在张凯看来,两种策略相比之下,渐进式才是推动人类实现自动驾驶的最佳路径。“首先,渐进式路线量产时间更早,能够更早形成规模化。相对跃进式路线,渐进式更容易获得足够数量的数据。其次,渐进式路线是从用户真实使用场景中获得的数据,相对跃进式定向采集数据方式而言,成本更低,质量更高。”

  而在渐进式策略中,成功的关键就在于数据。背靠长城汽车这种规模庞大的主机厂,毫末智行的规模化落地存在一定地保障性。为了更好发挥庞大数据优势,对车辆所产生的数亿自动驾驶里程的数据进行智能分析,以支持更大规模的应用。毫末智行于2021年底发布了自动驾驶数据智能体系——雪湖(MANA)。

  据毫末智行CEO顾维灏表示:“目前用户使用我们辅助驾驶产品所产生的辅助驾驶里程,已经接近1700万公里;我们的数据智能体系MANA的学习时长已经超过了31万小时,虚拟驾龄达到4万年。末端物流自动配送车也为附近用户运送了超过9万单的物资。数据的规模和多样性都在快速地增长。”


  除路线之争外,毫末智行也将自动驾驶技术发展分为了三个阶段:硬件驱动时代、软件驱动时代以及数据驱动时代。在硬件驱动时代,车辆被武装到牙齿,感知能力的强弱往往取决于谁的激光雷达数量多、线束多。但由于整体成本高,导致量产车型有限,自动驾驶里程规模较少。

  随着更大算力的中央计算芯片,自动驾驶也走入了软件驱动时代,AI在车上开始广泛应用。在感知方向,各个传感器各自为战,用一些小模型和少量数据做训练,得到单个传感器的识别结果,然后进行感知结果级的融合;在认知方向,则依旧以人工规则为主。在此阶段中,整体成本逐步下降,效果则逐渐提升,自动驾驶里程也迅速提升,达到上千万公里。

  如今,自动驾驶领域已开始进入3.0时代——数据驱动时代。“数据驱动时代,是完全不一样的时代,是数据自己训练自己的时代,我们所做的一切的,都是为了能够做出数据通道和计算中心,以便可以更高效的获取数据,并把数据转化为知识。在感知方向,是用多个传感器、不同模态传感器的原始数据联合输出感知结果;在认知方向,通过大量人驾数据抽取可解释的场景化驾驶常识,在配以AI的实时计算,可以更加拟人化的融入社会交通流中;训练的方式,也发生了很多变化,主要是从小模型少数据,转成刚才提及的大模型和真正的大数据,是那种1亿公里以上的辅助驾驶里程所产出的数据。”


  目前,毫末智行正在加速进入数据驱动时代,摆在这家企业面前的则是新时代的六大挑战。挑战一是如何在自动驾驶领域应用大模型。对此,业界常用的方式是监督学习。虽然毫末智行拥有自动标注的手段,样本标注的时间成本和金钱成本还是很高。在顾维灏看来,应对这一挑战的关键还在于能够直接使用大量无标注数据的方法,毫末智行选择的是将所有的感知任务backbone都统一,然后利用无标注数据先训练好这个统一backbone并锁定,模型剩余部分再用标注样本来训练。


  挑战二是存量数据规模巨大的前提下,如何让模型能够对新场景保持敏感,而不会陷入可怕的遗忘性灾难。为此,毫末智行构造了一个增量式的学习训练平台。在训练过程中抽取部分存量数据加上新数据组合成一个混合数据集。相比于用全量数据再次精细的训练模型,毫末智行,在同样的精度下可以节省80%以上的算力,收敛时间也可以提升6倍以上。


  挑战三是如何使用重感知技术解决空间理解问题。在顾维灏看来,城市场景里的道路环境发生变化的频率远远高于高速场景,如果把地图看作一个传感器的话,那么这个传感器的置信度是有些问题的,不知道什么时候什么地方它就会失效。所以毫末智行选择了重感知轻地图的路线,在城市实现导航自动驾驶只用普通导航地图,不依赖高精地图。


  为了提升自动驾驶系统的时空理解能力,毫末智行用时序的transformer模型在BEV空间上做了虚拟实时建图,通过这种方式让感知车道线的输出更加准确和稳定

  挑战四是如何让自动驾驶系统能够使用人类世界的交互接口。此前,业界做法是用传感器感知和算法预测周围交通参与者的意图。而在城市环境下,交通参与者的活动变得更复杂,预测的难度加大。为此,毫末智行升级车上的感知系统,加入了对车辆信号灯状态的专门识别,包括刹车灯和转向灯。以达到在前车减速,周围车辆切入等场景中开的更安全和更舒适。


  挑战五是如何让仿真更真实。在顾维灏看来,对于仿真,主要有三个层次的工作。一个是基础仿真能力,仿真环境和运动的基础能力,主要衡量的是精准性;一个构建场景的能力,主要看的效率;另一个定义场景的能力,主要看有效性。

  以城市路口的场景为例,毫末智行通过与阿里以及相关部门合作,利用路端设备将路口处每时每刻的真实交通流都记录下来,再通过log2world的方式导入到仿真引擎里面,加上驾驶员模型之后,就可以用于路口场景的调试验证。

  挑战六是如何让车运动起来更像人。毫末智行的做法是对覆盖海量人驾进行深度理解,构建毫末自动驾驶场景库,并基于典型场景挖掘海量司机的实际驾驶行为,构建taskpromt,训练一个基于时空Attention的驾驶决策预训练大模型,使得自动驾驶决策更像人类实际驾驶行为,以保证实现自动驾驶决策的可控、可解释。(文/ 陈灿)