特斯拉选择彻底“抛弃”融合感知,未来主流技术路线何去何从?

高级别自动驾驶的量产“排位”争夺战,正在上演。其中的焦点,自然是硬件配置的升级,从4D成像雷达到激光雷达的陆续量产上车。
近日,特斯拉CEO伊隆·马斯克证实,FSD Beta 9.0已经准备好,预计将在本月下旬进行交付。同时,FSD测试版用户规模将同步扩大,在此前2000名用户的基础上扩大10倍,以便收集更多真实道路数据以及应用案例。
而在大洋彼岸,小鹏汽车刚刚完成一次3000公里的NGP(自动驾驶导航辅助)实际长途道路演示挑战。在各项指标上,都实现了对特斯拉NOA(Navigate on Autopilot)的超越。
与此同时,小鹏汽车的第三款车型P5将首次搭载激光雷达(预计将实现NGP功能在城市复杂路况下的使用),计划将于10月投产,年底正式上市。此外,华为首款全家桶智能驾驶方案落地车型北汽极狐阿尔法S也将亮相,同样搭载激光雷达。
到目前为止,激光雷达“上车”阵营已经初步形成,包括蔚来汽车(图达通)、Lucid Motor(速腾聚创)、长城汽车(Ibeo)、上汽R汽车(Luminar)、宝马(Innoviz/法雷奥)、奔驰(法雷奥)、本田(法雷奥)、丰田(电装+大陆集团)、沃尔沃(Luminar)等多家主机厂。
相反,特斯拉仍在坚持自己的选择。
FSD Beta 9.0被特斯拉视为自动驾驶技术堆栈的巨大改变。埃隆·马斯克近日在推特上解释说,最新的系统可实现在纯视觉(没有雷达)感知的情况下,克服更多的边缘场景以及恶劣天气。


目前还不清楚,马斯克的这句话是否真的会兑现。特斯拉如果“撤掉”仅有的一颗前向毫米波雷达,可以为每辆车节省50美元至200美元的成本。
但有一点非常清楚,特斯拉将继续保持“特立独行”的风格。
一、纯视觉路线,不是谁都能玩
如果说,短期内不采纳激光雷达可能是考虑到成本和技术成熟度问题,“抛弃”毫米波雷达,看起来更是一个疯狂的想法。
通常情况下,像雾、雨、雪、黑夜这样的天气条件被视为毫米波雷达的天然优势,至少在目前的视觉感知软硬件主流性能条件下,这是正确的,也是行业一致认同的。但显然特斯拉不这么认为。
一直以来,毫米波雷达是ACC、AEB等ADAS功能的必备传感器之一,相比摄像头,在测距、测速方面有着自己的先天优势。同时,4D成像雷达的升级,也使得传统毫米波雷达迎来了全新的应用空间。
现在,特斯拉准备用视觉取代雷达,可能是采取摄像头快速捕捉画面,通过比较几帧间的物体运动变化,来推断与前车或者其他物体之间的速度差。
此外,由于特斯拉一直在基于“影子模式”采集道路数据,同时基于模拟仿真训练证明视觉深度学习的能力。马斯克的笃定,意味着特斯拉从数据中已经可以证实:视觉技术可以超越现有雷达的能力。

原因是,摄像头的数据速率(比特/秒)远远超过雷达几个数量级。特斯拉的深度学习能力已经能够更好地理解前方的环境,并对摄像头“看到”的东西做出正确反应。

此外,对于目前行业内普遍采取的多传感融合策略,马斯克指出:当雷达和视觉不一致时,你相信哪一个?视觉有更好的精度,所以纯视觉比传感器融合方式更好。
这一点,在吉利领克ZERO(极氪001)上的感知方案,也可见一斑。作为领克全新的高端电动车型,搭载的L2+自动辅助驾驶系统将搭载Mobileye的全功能360度摄像头解决方案。

这套方案,基于两颗Mobileye EyeQ5® SoC ,搭载七个远距离和4个近距离的摄像头(360度全景),提供基础的AEB、ACC、LKA(满足法规和新车评级),APA以及支持高速公路自动驾驶以及可以放开双手的城区自动驾驶。
同时,方案也搭载了Mobileye的基于责任敏感安全(RSS)的控制策略,帮助车辆在看不到车道标记和其他道路使用者可能构成危险的情况下安全行驶。基于众包、不断刷新的地图数据,由REM提供支持。
在马斯克看来,通过增加摄像头,同样可以替代过去通过雷达信号发射(前车底部)实现的“超视距”感知能力。“5个前置摄像头,至少有一个摄像头可以看到前面有多辆车。”
一些业内人士指出,或许此前特斯拉车辆发生的数起撞上横向行驶白色卡车、停在路边的静止车辆,有可能是视觉、雷达信号的融合判断“冲突”有关。
与此同时,近年来潜伏多年的神经形态(又被称为基于事件感知)视觉传感器又开始卷土重来。基于事件感知的摄像头可用于多种应用,其中之一就是实现单目感知环境下的深度估计。
此外,这种系统可自动持续校准,同时也可以提供自动驾驶系统所需的角度和距离分辨率。与激光雷达系统相比,在大雨、雪和雾等恶劣天气也表现良好。
有消息称,目前英特尔旗下的Mobileye公司推出的纯视觉L4方案,正是基于英特尔的立体图像分析技术(不是传统意义上的双目视觉)。
这套名为True VIEW的技术,原理是通过在各个位置安装多个高清摄像头,帮助定义三维空间体积,并拆分成成千上万个数据点(也就是“Voxel”),再通过机器建模,最终得到一个完全虚拟的三维数字世界。
去年,Mobileye发布了一段自动驾驶测试视频,仅搭载纯摄像头感知硬件的车辆在以色列耶路撒冷城区进行了一次大约20分钟的测试,这段视频令人印象深刻。
而此前特斯拉推出的多维(4D)视图技术,就是无缝地整合摄像头360度感知能力进行拼接,“摄像头将模拟出激光雷达的核心功能。”这套系统的逻辑是,通过多摄像头的数据整合成一个完整的视频,并实时进行标签,从而获得深度信息。
特斯拉实现完全自动驾驶的方法部分基于这样一种理念,即人类只通过视觉就可以完成驾驶,无需使用任何雷达或激光雷达。事实上,自2019年以来,特斯拉的多位高管就一直强调上述理念。
不过,纯视觉路线取决于多种因素,比如芯片的自主研发设计、长期以来在深度学习等AI技术上的投入,实际道路行驶数据的采集和训练等等;在这一点上,大部分企业难以在短期内“拷贝”特斯拉模式。
二、或将推动激光雷达加速上车
巧合的是,最近Waymo的第一任CEO突然宣布离职,一些机构认为这是马斯克的阶段性胜利。Waymo过于昂贵的自动驾驶技术路线,也无法兑现商业化计划,除了监管问题,如何保障安全还是未知数。
一些行业人士表示,不管是什么级别的自动驾驶,大规模上路才是王道。过于侧重虚拟仿真并非是最终的解决方案。“无法商业化,就是Demo。”
而特斯拉在低成本的视觉路线上“突飞猛进”,让一些资本市场的玩家感受到了潜在的风险,纷纷看跌相关公司股价。
最近两个月时间,5家在美股上市的激光雷达初创公司(Luminar、Ouster、Aeva、Velodyne、Innoviz)的股价平均下跌了22%。
相比之下,道琼斯工业股票平均价格指数和标准普尔500指数3月份分别上涨了7%和4%,纳斯达克综合指数上涨0.4%。
而作为目前全球市值最高的激光雷达公司,Luminar的股价在过去一个月时间下滑了近40%,市值从最高峰的100多亿美金下滑到了70亿美元。
不过,激光雷达的作用仍然不可忽视。
亮道智能从2017年开始搭建了针对感知功能开发的自动化测试验证体系,实现了从激光雷达“开发-测试”的闭环。在该公司负责人看来,激光雷达在获取目标物3D轮廓,精准测距与实时轨迹追踪等方面,具备天然优势。
此前,Mobileye也多次强调,将采用“视觉+激光雷达”的方法,将视觉放在首位,但希望使用激光雷达来做安全冗余。原因是激光雷达是一个关键的冗余部件,能够弥补摄像头的不足之处。
Mobileye也正在面向高级别自动驾驶打造两套并行量产方案,其一是类似特斯拉的模式,倚重摄像头,类似为领克平台提供的SuperVision™方案,其二是集成了成像雷达、激光雷达的完整感知方案。
目前,除了与采购Luminar的激光雷达做前期测试,Mobileye已经宣布借助母公司英特尔的技术研发激光雷达系统芯片(SoC)等核心组件,实现2025年L4级自动驾驶成本大幅下降目标。
“我不生活在(马斯克)的世界里,”Innoviz联合创始人表示,“五年前,由于当时没有好的激光雷达,启动纯视觉FSD方案是正确的决定。但现在,并非最佳选择。”
大部分汽车制造商似乎也同意这一观点。他们正在使用激光雷达实现未来几年将推出的L3级自动驾驶新车的计划。即便特斯拉成功了,也并不意味着激光雷达的消亡。
一些行业人士表示,如果有什么区别的话,特斯拉的成功,可能会加速其他汽车制造商加快他们的自动驾驶计划,也将有更多的激光雷达量产上车。
毕竟和几年前相比,目前激光雷达无论是在性能稳定性/可靠性、软件算法、生产制造、车规级/功能安全验证、供应链完善度等多个方面已经实现一定程度上的突破,尽管这个行业还处于起步阶段。
更重要的原因是,大部分汽车制造商在视觉感知技术上的投入以及达到的技术高度,还有“冒险”的精神,都不及特斯拉。
“大部分企业会选择保守模式,正如特斯拉敢冒着个人隐私风险采集车内数据一样。”上述人士表示,传统汽车制造商会更遵守现有法规以及安全第一的理念。
同时,在新车营销上,对于普通消费者来说,更多的传感器代表着“更安全”的系统,这一点也是不容忽视的。而随着特斯拉不断出现安全事故,负面影响也是不言而喻的。
不过,在高工智能汽车研究院来看,接下来的感知路线,也将会出现一些分化迹象,核心还是围绕成本和技术成熟度展开。
1、对于入门级L2自动辅助驾驶,纯视觉方案由于成本以及算法(相比融合的复杂度)的优势,正在成为主打性价比区间的新车配置方案首选项,去年哈弗大狗、第三代哈弗H6等车型上已经落地类似方案。
2、视觉+雷达(1V1R+2R/4R),则是中端价位区间车型的选择项,这部分车型在L2功能上会有更多的复杂度增加,包括人机交互的自动换道功能。
3、对于复杂的L2+、L3级自动驾驶,4D成像雷达+视觉(包括双目立体方案),再加上激光雷达(高端选装配置),会成为配置方案的主流。