华为自动驾驶火出圈,是噱头还是真实力?内行人“一语道破”!
上海车展前夕,一段极狐阿尔法S华为HI版的路测视频火出了圈,视频中装备华为ADS自动驾驶解决方案的极狐阿尔法S从容应对无保护左转、左转抢行机动车、鬼探头电动车的情景令人惊讶。一时间,华为“闷声学习,一鸣惊人”的学霸形象跃然纸上,人们也对L4落地的时间充满了乐观。
(ARCFOX极狐 阿尔法S)
与夸奖一并出现的必然是争议。先是百度方面人士在公开场合发表了火药味十足的言论:“我们这行光吹牛的后来都凉凉了,还是多做事吧。”后面某社交平台又出现了自称华为前员工的内部人士发言,直指华为虚假宣传,夸大系统能力。一时间江湖信息虚虚实实,技术解析和公关话术相互交织,真假难辨。
(互联网匿名人士发表的评论)
那么事实究竟如何,华为是不是真的厉害,L4自动驾驶行业发展现状又是怎样?为了解惑,我找到了两位对这一领域了解更加深入的朋友——小王和小江。小王目前就职于某自动驾驶方案供应商,是轨迹预测算法工程师;小江则是香港科技大学在读博士研究生,目前所在科室从事机器人、自动化、视觉识别等多类项目的基础学科研究。
(华为ADS全称“高阶自动驾驶全栈解决方案”)
两位朋友一位是一线工程师,一位是基础学科研究者,他们的视角互有不同,但都比我这样的门外汉专业不少。他们提供的信息不仅能为目前互联网上的常见争议提供参考,也为当前行业发展现状勾绘了一副大致图景。
我们就“华为实际展现出的技术实力”、“自动驾驶的工作原理”、“视觉/雷达路线之争”和“L4落地的具体时间”四个核心主题进行了讨论,今天就跟各位汇报汇报我们聊到了哪些“干货”。
全文速览
1. 华为ADS在路测视频中展示出的性能属于行业平均水平,并未大幅领先竞品;
2. 自动驾驶系统“看得多、看得远”,很多决策逻辑与真人司机不同;
3. 纯视觉方案有一定局限性,受访业内人士更加看好包含激光雷达的多传感器协同方案;
4. 硬件性能、芯片算力并非一切,算法质量、软硬协同才是关键;
5. 距离L4大规模商用尚需时日,消费者还得耐心等待。
是实力还是营销
华为真有这么厉害?
开门见山,我们聊的第一个问题直指当前争论:在自动驾驶行业,华为段位究竟几何?
工程师小王坦率地告诉我,他们这个行业要从技术内核评价友商能力还是挺有难度。一方面各家方案都是商业机密,了解竞品信息基本就只能凭借路试视频和公开发表内容,另一方面各家发布会公开信息很难证实/证伪,自然没有太强信度。小江也直言自己作为程序员“最相信自己写的代码,别人写的啥样自己心里没数。”所以二位的评价也都是基于这段火遍全网的公开视频而来。
小江对华为这套系统给出了赞赏,主要原因还是这是一段一刀未剪的公开测试视频,同时邀请媒体跟车拍摄,至少说明这套系统的可靠性和平顺性能够达到公开路演的程度。
不过作为一线从业者,小王对这段视频的评价就低了很多,他直言这正如此前“华为前员工”所言,就是行业平均水准,目前叫得上名号的公司都能做到这个程度。给出这个评价主要是基于路测路段比较宽敞,也没有出现严重遮挡的恶劣情景,车流量同样不算很大,综合来看,并不算是有挑战性的路况。
(小王看来,这种路况只能算是一般难度)
从小王的视角看,对自动驾驶系统性能挑战较大的还是车身所处物理空间的大小,以及车身周围识别物的数量。换言之,如果演示路况是一段两侧停满机动车的单车道单行线、大幅上下坡工况或是人车混杂的农贸市场,那对于系统才是更加严峻的考验。
(此类路况才更能考验系统上限)
对于华为给出的“城市路况1000公里无接管”的系统性能,小王也持悲观态度,主要原因在于华为并未给出“1000公里”所对应的路况条件。
“理想条件别说1000公里、2000公里都能做到,但是现实情况太复杂了,需要在很多地区,很多路况下进行测试……尽管各家公司都爱宣传能跑多少公里,但是实际路测工况都是各家的机密,没有人公开,所以这个数据任人说,我们也无从判断各家实际水平……我们当然会不断进步,不断优化,解决一个个问题,但是公开展示时肯定不会把问题暴露出来…那位'前员工’给出的'城市30km、高速100km’的数据更加符合我所了解的行业现状,而且这也是'天时地利人和’兼备情况下才能做到的数据。”
(小鹏NGP目前实现的是高速公路路况下的自动驾驶辅助)
“那视频里电动车随便乱窜,还有左转汽车路口抢行的情况,对于新手司机都是很有挑战性的,自动驾驶汽车能做好岂不是挺厉害吗?”不甘心的我接着问。
这就谈到小王本职工作所涉及的领域了。作为轨迹预测算法工程师,小王需要帮助自动驾驶汽车预测所识别到周边物体的运动轨迹,并想好应对策略。也正是通过我举的这两个例子,小王向我详细解释了自动驾驶汽车“看”世界的方式与真人司机有何不同。
透过现象看本质
自动驾驶汽车'看到’的世界长什么样?
作为普通司机,可能会在潜意识中忘记自动驾驶系统比人“看得更多,看得更远”这两件事。事实上,当前的自动驾驶系统基本都能做到同时检测到车身周边几十上百个物体,比真人看得全面多了。
(激光雷达“看到”的世界)
先说左转抢行的工况。从算法工程师的角度,事实上在对向车辆驶入路口前,车辆的传感器就已经检测到来车,并且根据来车车速等数据进行了“来车直行”和“来车左转”两种轨迹预测,自动驾驶系统也早已对这种两种情况的行驶轨迹进行过演算。换言之,还没进路口呢,汽车已经“想好”自己和其他车辆会如何通过路口了。
(此时,车辆已经完成轨迹预测)
当监测到来车左转向灯点亮,并且车速降低幅度不足以刹停时,自动驾驶系统确认来车可能有强行左转意图,这时应对抢行的预案也已经做好。
(转向灯点亮,确认对向车左转意图)
当抢行真正发生、乘客心里一惊时,汽车这边其实早已胸有成竹了——“早就猜到你丫要抢道了,那我刹车就好咯。”
那为什么也是最后一刻才刹车呢?这就聊到具有挑战性之处了。小王和小江告诉我,轨迹预测、车机协同等中间环节任意一个节点做得有瑕疵,都会造成急刹等不平顺的行驶表现。作为算法工程师,工作之一就是排查中间环节做得不好之处,并进行处理。
换言之,车辆做实时决策的时间和数量要大幅早于、多于真人司机,很多真人司机认为是突发的情况在自动驾驶汽车和算法工程师眼中都是意料之中的事。
应对电动车鬼探头也是同理,其实自动驾驶汽车早在几十米前就已经“看到”了电动车,并且预测到它会驶入盲区,做出这一判断的时间点大幅早于人类司机。
(L4级别对鬼探头工况的识别时机要大幅早于L2)
为了给我具象化展示这些情况,小王为我展示了一段业内其他公司的城市路况测试视频。以下截图取自今年三月,小马智行自动驾驶汽车在广州市区交通高峰期的路试视频。我们可以看到在很远的位置汽车就已经识别到“鬼探头”行人,并持续跟踪其轨迹。
此外,借助长焦摄像头,该公司的自动驾驶汽车也可以在人类视距外识别到路口信号灯,实现更加平顺的行驶表现。
这也从侧面印证了,其他家的方案也能够做到华为视频所展示的水平,只是它们在内容传播水平上比华为逊色,没能率先破圈。
对于有人提到针对特定路试工况进行调优的情况,小王和小江均表示在技术上确实可行。具体手法包括屏蔽测试路段一些识别对象(栏杆、灯柱、绿化带、行道树等),让车子提前“背过”一些比高精地图更加精细的信息,这样车辆上路行驶时就能把算力全部分配给路演当日路面随机发生的情况,系统反应就会更快;此外还可以对日常路试中遇到的不平顺工况(半坡起步等)进行针对性调优,车辆路试就会更加顺利。
此外还有更加简单粗暴的“物理开挂”方法。小王分享了这样一件业内轶事:曾听闻行业内某公司的路试路段行道树过多,对传感器干扰过大,该公司在演示前直接雇人修剪了行道树,以期获得更加优秀的性能表现,想来也蛮神奇。
(怕信号干扰?剪秃即可!)
近期另一话题热点便是在威马W6上搭载的,由百度Apollo提供技术支持的AVP无人自主泊车系统。这套系统宣称率先实现了L4级别无人驾驶,在住宅、公司等固定车位场景,车辆仅需学习一次即可自主寻径泊车。
(威马W6和AVP无人自主泊车系统)
对此,小江为我提供了一份2020年7月公开发表的学术论文,上面详细介绍了一套实现类似功能的技术方案。这套来自华为自动驾驶团队的方案通过车载摄像头识别车库内标线、车位画线、减速带位置等“视觉语义特征”(Semantic features)绘制了一套“视觉语义图”,第一次驾驶车辆入库,车辆自行学习地图后,就能实现无人全自动泊车的功能,解决了地库内无人驾驶系统无法使用卫星定位、暗光画质差、场景重复度高,不易识别的痛点。
(摄像头拍摄画面(左)及经处理识别到的“视觉语义特征”(右):黄色为标线,灰色为立柱,深蓝色为减速带)
(系统自动绘制的车库地图)
举这个例子并不是想说威马/百度使用了类似算法,也不代表华为现在的产品搭载的方案与之完全一致,只是为大家多提供一种思路,帮助各位理解自动驾驶的工作原理。此外,这也说明自动驾驶是一个庞大的系统,其中包含了很多个类似的小算法,有的负责识别人、车、信号灯等物体并进行分割,有的负责预测轨迹,有的负责自动泊车。它们协同工作,帮助车辆实现自动驾驶的大任务。
读到这里,你可能已经注意到,自动驾驶系统的性能从很大程度上取决于传感器采集到的数据量。当前华为的多传感器豪装方案和特斯拉、百度视觉为重的技术路线形成了鲜明对比,也引发了一轮争议。
针对这两种技术路线之争,我也询问了两位朋友的看法。
技术路线之争
纯视觉方案、摄像头雷达协同,谁才是王道?
在这个问题上,小王和小江的观点十分一致:二人都更加看好带有激光雷达的多传感器协同方案。对于马斯克坚定推崇的纯视觉路线,二人的评价也都比较尖锐。
(Model 3全车有多个驾驶辅助摄像头)
用小江的话说,“既然要用计算机完成这个任务,当然要选择计算机擅长的方式做事。处理大量数据是计算机的强项,训练AI模型也需要给模型喂进大量数据才能够更好地调优,自然是数据越全面越好,何必非得拘泥于'人类擅长的方式’呢?”
(前视摄像头看到的世界)
在小王看来,目前摄像头在性能上还是有不少局限性,对光线的敏感度和画质等都远不如人眼,其中一些性能差距很难用算法去弥补。比如使用纯视觉判断车距需要严重依赖AI模型,得出的结果不具备可靠性,像这些场景依旧需要雷达给出最精确的数据。
但是小王同时认为,像华为这样一次把传感器堆到满也不是最优解,至少目前的demo中并没有体现出多出的传感器所能实现的性能增益。
“(华为)硬件配置算是奢华,但是传感器数量到一个水平,360°全覆盖就够用了,其它东西还是要靠算法解决,因为有些情况就算堆再多传感器,该检测不到还是检测不到。例如前方卡车遮挡这种工况,都给你遮严实了,无论是一个传感器还是一堆传感器,效果没区别的,总不能把雷达安到杆子上,举高越过卡车去看吧。”
(三星针对卡车遮挡给出了有趣的解决方案)
二人看来,华为的优势并不是体现在硬件设备豪华,而是具备硬件自研自产的能力,可以做到更加优秀的成本控制,相应也就可以做到田忌赛马的产品规划。“上马”硬件产能打开,成本降低后就可以降维打击别家的“中马”,产品节奏掌握在自己手中。
(硬件自研自产意味着对成本有更强的控制力)
另一方面,车规芯片的算力水平也是近期各家的营销热点,从特斯拉双72TOPS算力的视觉芯片到蔚来ET7上1016TOPS自动驾驶超算平台,算力数字越来越大,大有几分军备竞赛的味道。
(蔚来ET7号称具有1016TOPS的算力)
那么算力真的能和自动驾驶的性能挂钩吗?对此问题,两位朋友的回答都相对冷静客观。二人都认为更大的算力对自动驾驶绝对是利好,这意味着执行算法的速度会更快,能够同时计算的任务数量也更多;但在关注硬件性能的同时,不能忽视代码的质量。质量更高的代码能在占用更少算力的同时实现更加优秀的性能表现,甚至实现以小搏大的效果。
综上所述,尽管二人都更加看好激光雷达、毫米波雷达和摄像头协同工作的系统方案,但豪华的传感器配置和夸张的算力并不能代表自动驾驶系统的绝对性能。在这样一个软硬协同的游戏中,代码的质量同样是关键一环。
未来已来?
L4离我们究竟还有多远?
这次讨论的最后一个话题,我们聊了聊消费者们更加关心的事儿。目前极狐阿尔法S华为HI版已经公布38.89-42.99万元的指导价,百度也宣布2021年下半年每月将有一款搭载Apollo自动驾驶系统的新车上市,配合最近看到的多个路演视频,好似L4大面积铺开已经近在眼前。这是事实,还是各厂高密度宣传给人营造的错觉呢?
不同于厂家宣传,我的两位朋友对L4落地时间都持十分保守的态度。
一方面,他们认为L4进入实用阶段的时间不仅仅取决于车子的硬件性能和本地计算;基础设施配套,或俗称的“车路协同”会是非常重要的一环。当前的自动驾驶系统还是极度依赖于高精地图等本地数据,而采集数据并保障其时效性需要耗费大量时间和资源;其次,随着5G网络铺开,自动驾驶汽车可以相互、或与基础设施实时分享车流量,交通信号等信息,那时可能才是自动驾驶真正大规模落地之日。对了,这里还没有谈到法规制定等技术之外的伦理问题呢。
(车路协同才是自动驾驶的终局)
另一方面,当前的自动驾驶系统还有一些基础算法问题亟待解决。两位朋友给我举了两个例子:在两侧都是玻璃幕墙或大橱窗的道路行驶时,自动驾驶的视觉识别方案可能会将玻璃中的倒影认作道路;逢年过节路上张灯结彩,悬挂大量彩灯和灯笼时,使用视觉方案识别信号灯同样是个挑战,更不用说恶劣天气,或者能见度极差工况下的自动驾驶。这些都属于目前还没能找到完善算法解决方案的现实问题,尽管随着智能交通路网建设和高精地图绘制,这些问题终将得到解决,但我们需要给予技术发展更多耐心。
(此类工况对于视觉识别算法依旧具有不小的挑战性)
因此,两人都无法对L4大规模落地的时间给出具体预测,但二人均认为会比当前厂商宣传迟不少,“可能是几年,可能是十几年,现在谁也说不好”,2017年发布的一份行业报告中,则明确指出了2030年这个时间点。但无论如何,这些时间点都没有各家宣发时所暗示的信息那样乐观。
不过二位朋友也指出,特定场景下的自动驾驶离我们已经很近了,例如高速公路货运车辆编队行驶,港口物流运输以及之前提到的地下车库自动泊车等,这些应用的共性是环境相对比较单一(地库中标线等识别物不会轻易变动),场景的可控性也更好(集装箱码头可以禁止人员进入),在这些限定条件下,无人自动驾驶已近在眼前。
总结
与二位朋友交流后,我的头脑冷静了一些。一方面,我欣喜地发现并不只是华为、百度等科技巨头拥有可供路演的技术方案。事实上,自动驾驶领域现在算是“百花齐放”,行业整体发展速度要远超预期,大家都蛮厉害;另一方面,面对各家宣传,我们还是得持更加审慎的态度,尽管我们目前看到的演示完成度都挺高,但整个行业还都面临一些或大或小的技术挑战,技术真正落地实用尚需时日,我们也需要多点耐心。
至于如今的L4自动驾驶汽车是否值得购买?我觉得这还得取决于个人心态,首先我们得清楚认识到当前技术的局限性:可能你买到的“L4”和内心期待的L4还存在着不小的差距;其次,几万元到十几万元的“尝鲜成本”也确实不是小数字。因此,工薪阶层大可以按捺一下激动的心情,毕竟俗话说得好,“等等党终将大获全胜”。
最后,感谢您能耐心读到这里。如果有什么对自动驾驶的期待,或者有什么观点想与我们分享,欢迎在下方留言,我们期待与您进行互动。