新能源三部曲(二)自动驾驶
“全世界有两种自动驾驶,一种是特斯拉,一种是其他。这句话不是称赞特斯拉的技术有多强,而是特斯拉的自动驾驶方案只有经典四步法里的三步,即抛弃高精度地图定位。而世界上其他所有厂商都认为完善的高精度地图+定位是实现L3/L4的先决条件。那么到底哪种技术路线能够胜出呢?在具体的实现过程中,又有自下而上的整车厂(l2->l3->l4),跟自上而下的自动驾驶软件供应商(l4)两种进攻路线,又是哪一种能够获胜呢?”
上一篇我们聊了新能源车是新物种,电池,芯片,传感器,自动驾驶软件,他们都能以类摩尔定律的方式快速进化,从而把燃油车远远甩开!而能把两者彻底隔离开的关键因素就是自动驾驶,完全自动驾驶之后,车就成为一件拥有强大运算能力,丰富环境感知能力,良好私密性,可移动的电子产品,就跟2007年乔布斯发布iphone一样,它将如何改变我们的生产生活完全不可想象。本篇文章,我会在认知能力范围内为大家讲解自动驾驶的技术原理,不同进攻路线的优劣,以及对未来的推演。由于本人并未直接从事自动驾驶行业,部分知识可能存在认知偏差,还望专业人士批评指正。
一,深度学习的数据燃料
由于深度学习在整个自动驾驶技术中的重要性,我不得不在最开始对深度学习进行一个简单的介绍,很多结论的推演必须依赖你了解深度学习的基本原理,好在理解他并不难,反而非常的直接。深度学习模拟人脑的神经网络计算,就像小时候妈妈反复的指着苹果告诉你这是苹果一样,久而久之你就会认识苹果了,下面举个例子帮助理解。
一个系统一般分三个部分,输入,输出,模型,比如这里,输入是x,输出是y,模型是未知的函数f(x)。如果我们有大量输入输出数据——(xi->yi),那么我们可以建立n层神经网络模型,每个节点有不同的参数,用已知的这些(xi->yi)数据去训练,得到一组最优的参数,使得这个神经网络运算结果尽可能的逼近真实函数f(x)。没错,只要数据足够多,训练结果就会无限接近真实函数f(x),所以你经常听到下面这句话:
数据越多,AI就越智能!
其实这句话只对了一半,不是数据越多AI就越好,是标签化的数据越多AI越好。xi是数据,(xi->yi)就是标签化的数据,一般xi可以大量廉价获取,而对应的yi则需要人工标注,所以称为标签化的数据。假如我们要训练一个从图像中识别车辆,行人等可移动障碍物的神经网络模型,那么xi就是车上摄像头拍摄照片,yi就是各个障碍物的包围盒以及3维空间位置。
上图就是一个标签化后的数据(x1->y1),x1我们不断的拍照即可获得,但是y1需要人工进行数据标注,由于AI训练需要大量的数据,由此还催生了一个数据标注产业。数据标柱人工太贵,于是又进一步催生了数据自动标注这样的新研究方向,堪称人工智能行业的人工智能化。。。
除了大量标签化数据,神经网络模型要想泛化,提升适用范围,还需要数据的多样化。如果你的训练数据从来都没有包含猫狗等数据,那么就别指望训练出来的模型能够处理猫狗的图片。所以模型必须持续的迭代,使得他的适用场景越来越宽广。
这里最关键的就是极端情况的数据收集,一般指的是原有训练好的模型失效了,安全员不得不介入的情况,此时的数据是最有价值的。这里必须点赞特斯拉的影子算法,实在是太巧妙了!
特斯拉在2019年发布“影子算法”,车主在未开启AP/FSD手动行驶时,自动驾驶也会默默开启,当人类司机的操作跟算法演算的不一致,此时的数据相当于安全员不得不介入的极端情况,记录并上传这部分极端数据,重新训练,算法能覆盖的边界进一步扩大,再OTA更新到全球的特斯拉车子上,周而复始。那么全世界的特斯拉车主都在帮AP/FSD不断的提升AI能力,我提供数据,同时也是受益方,人人都是自利性,结果世界却更好了!
综上所述,我们得出两个提升AI能力的关键因素:
1,尽可能多的标签化数据
2,不断迭代收集极端数据
二,自动驾驶的经典四步法
自动驾驶包含四个经典步骤:
1,环境感知
2,高精度地图定位
3,路径规划
4,运动控制
几乎每一步都需要AI的参数,下面我们一一展开。
1,环境感知
环境感知是指利用车身传感器,获取车身周围环境信息,主要分为四大块:静态物体检测,动态物体检测,车道线检测以及语义划分。主流的传感器类型如下图所示,各有优缺点,一般整车厂会结合多种传感器,交叉融合,得到全面可靠的信息。
这里面用到大量深度学习模型,当然也是困难重重,目前并没有完美解决,举一些困难的例子:
(1)红绿灯、交通标识属于静态小物体检测,在图像中所占的像素比极少,尤其远距离的路口,识别难度更大。如下图红绿灯在1920*1208的像素层面上占据的像素大小仅为18*45pixel左右,在强光照的情况下,人眼都难以辨别,而停在路口的斑马线前的汽车,需要对红绿灯进行正确的识别才能做下一步的判断。。。
(2)动态物体遮挡下的车道线识别;
(3)道路坡度曲率的识别;
(4)电线杆,树木,路边栏杆的识别和距离判断;
(5)超过摄像头距离的环境一无所知(300米开外);
(6)夜间,雾天等恶劣天气;
。。。
2,高精度地图定位
好消息是,只要有高精度地图,配合精准定位算法,上面这些难题便可以迎刃而解。高精度地图可以做到10厘米级别的精度,包含车道线,交通灯,道路坡度,电线杆等所有静态场景信息。精准定位技术已经非常成熟,配合高精度地图,对静态场景的识别,语义分析可以做到99分,剩下一分是更新是否及时的问题,百度Apollo高精度地图号称可以做到日更新。这样一来算力资源集中在动态物体监测,这无疑增加了系统运行效率、提高了传感器监测精度、提升了自动驾驶安全性。目前除特斯拉外的所有厂商都视高精度地图为L3及以上自动驾驶的先决条件。
3,路径规划
在知道场景周围信息和目标地点后,选择一条最优路线,这就是路径规划;此时需要去理解各个动态障碍物的移动速度并推演他们各种可能的移动路线。并线时机,无保护路口左转时机,变道并线等等,这部分可以用到深度学习。在这里“影子算法”获取的数据天然就是已经标注过的了,(传感器数据->司机的行车路径)。
4,运动控制
在路径规划后,实际的执行过程中会遇到各种突发情况,行人横穿马路,其他车辆没有按照预定路线行走,这时候就需要即时调整,是避让,是减速停车,还是加速通过。另外执行操作后必然也需要重新进行路径规划。同第三部,这里也可以让人类司机充当老司机的角色,“影子算法”自动获取标签化的数据。咨询了部分从业人员后得知,3,4这两块有些自动驾驶软件公司并没有使用神经网络方案,还是用传统的算法来求解。
三,谁会胜出?
前戏比较长,接下来终于可以推演了。
1,特斯拉的AI能力是最强的吗?
在第一章我们总结出了AI能力提升的两个关键因素
一,尽可能多的标签化数据
二,不断迭代收集极端数据
那特斯拉符合这两个要素吗?2020年全球电动车总销量突破300万辆,其中特斯拉销量超过50万辆,每6辆电动车中就有一辆特斯拉。路上跑的每一辆特斯拉车都在源源不断的为特斯拉的自动驾驶算法收集数据。你可能发现了我之前特意强调了数据与标签化数据的差异,特斯拉只能收集输入数据xi,真正用于训练的标签化数据(xi->yi)一定多。
诚然,特斯拉保有量已经超过80万辆了,要给80万辆车每天行驶的所有数据进行人工标注是不可能的。特斯拉在去年的AI大会上透露,他的AI团队包含100名硬件工程师,200名软件工程师,以及500名数据标注师。纯人工的话,500名数据标注师估计只能标注100辆车。。。
自动标注成为救命药草,收集传感器数据的时候,顺便把人类老司机的操作行为也收集了。比如我要判断红绿灯现在是绿灯还是红灯,只要收集十字路口的车辆信息,这些车辆的照片数据就是输入xi,人类司机停车则是红灯,不停车直接过就是绿灯,这就是yi,当然可能有闯红灯的,可以交叉验证,大部分司机还是遵守交规的。其他障碍物识别的自动标注难度可能大些,流程也长些,但基本原理是一样的。所以我们得出如下结论:
在自动标注的协助下,特斯拉拥有最多的标签化数据
在影子算法的协助下,特斯拉不断迭代改进AI算法
两大关键因素完全符合,实际上数据多到马斯克为训练不过来头疼,这不2020年马斯卡宣布正在开发一台专门用于训练的超级计算机Dojo,计算能力是现在排名第一的两倍!
综上所述,特斯拉在自动驾驶领域的AI能力全球第一,不容反驳!
2,特斯拉的自动驾驶在中国能胜出吗?
在量产数据自动标注的优势下,在影子算法迭代飞轮不断转动的优势下,特斯拉自动驾驶一骑绝尘,听起来别的厂商都可以关门大吉了。但是有一样东西的问世改变了竞争格局,那就是——
高精度地图+精准定位
有了这个高精度地图,就像打dota开图一样,不管你AI预判多精准,终究不如人家直接预计算好放在那里的,还不用消耗算力。基建狂魔中国还在建立强大的新基建——5G车路协同v2x,智能的路,这个世界上如果只有一个国家能干成车路协同,那一定是中国。AI识别再强,对红绿灯也还是无法做到100%准确,但是5G车路协同,信号灯直接把当前红绿灯的状态发送给车辆。你对静态障碍物的识别,对车道线的识别永远也赶不上从预计算高精度地图获取。对超过300米以外的世界你一无所知,在做路径规划的时候少了很多长远优化的可能,但高精度地图可以告诉你这些。业界普遍认为,要实现L3及以上级别自动驾驶,高精度地图+强单车智能,两者缺一不可。
特斯拉选择了一条最难的路,他抛弃了高精度地图,他要靠单车纯视觉智能解决一切问题。这里存在两个问题:
纯视觉解决一切问题太难了,目前FSD的算力无法达到,有人戏称模型参数再多1亿个,算力再强1万倍有可能实现。。。最近waymo CEO又跟马斯克在twitter上互道SB。。。退一步讲,哪怕特斯拉天赋异禀,真的实现了,那他的方案里,算力芯片的运算能力也是其他车辆的几十上百倍,而高精度地图和车路协同几乎是免费的,这必然导致特斯拉的自动驾驶成本远超其他厂商,失去竞争优势。
所以,我的结论是,在中国,抛弃高精度地图的特斯拉路线不会获胜!
3,自上而下的优缺点
在中国有两类自动驾驶玩家,一类是自上而下的自动驾驶软件公司,直接研发L4级别无人驾驶,对标的场景是无人驾驶出租车市场,主要玩家有百度Apollo,小马智行,文远智行,AutoX、滴滴、PlusAI等。自上而下的好处是从一开始收集的数据就是最终L4方案的数据,不仅包含摄像头数据,更包含激光雷达的点云数据,激光雷达让障碍物深度识别变得亲而易举。特斯拉在图像识别上有数据训练优势,但缺少点云数据的积累,当然马斯克认为激光雷达多此一举,我就要走最难的路!放一张图让大家感受下激光雷达的魅力吧——
静态场景信息通过高精度地图精准获取,动态环境感知在激光雷达辅助下也变得简单很多(深度可以直接获取)。可以说高精度地图+激光雷达把整个行业的技术门槛极大的降低了。这也是全球能一下子冒出这多自动驾驶初创公司的原因。如果大家都走马斯克的纯视觉,无预计算路线,怕是没几家公司能上路测试。。。这也是小鹏说要把特斯拉在中国干趴的底气所在。。。
自上而下的缺点就是落地遥遥无期,烧钱源源不断,追求一步到位,中间不创造任何价值,除了融资还是融资。他们的最好结局应该就是被缺乏自研能力的传统整车厂收购。
4,自下而上的进攻路线
这是整车厂的进攻路线,自下而上,先从L2辅助驾驶开始,慢慢往上突破,每一步技术实现都能提升用户体验,带来实质性营收。这种路线不烧钱,而且相对自上而下的路线来说,量产车型可以免费获取海量路测数据,可谓最佳路线。国内代表就是造车三傻,说错了,造车新势力蔚来,小鹏,理想。蔚来,小鹏动作麻溜一些,已经推出了高速领航功能,理想慢一点,但实际上理想野心最大,他一直在收集数据,而且偷偷拿了一张乙级地图测绘资质,这是想干啥,想自己做高精度地图呀!利用量产车型免费建立,更新,维护高精度地图,@李想,祝你理想成真!
自下而上也有很多问题,过早的推出类L3的辅助驾驶功能风险极大,对于司机来说这有个悖论,我用高级辅助驾驶就是想偷懒刷个手机,小打个盹,但你又要求我时刻准备好接替系统驾驶,感觉宝宝心里很苦啊,我到底是不用呢还是不用呢?而技术上的不成熟又容易造成公众对自动驾驶的信任危机,特斯拉事故频发,最近蔚来ES8在高速巡航时撞上了一辆因故靠边停车的五菱宏光。
5,在中国,谁会胜出?
这是个终极问题,也是最难的问题,我思考了很久,先易后难吧,首先我们可以确认两件事——
(1)覆盖全中国的高精度地图很快就能完工
(2)中国会坚定不移的走车路协同的新基建路线
基于这两点我们先排除掉特斯拉这个怪兽(除非他转头拥抱高精度地图),然后是确认第三件事
(3)有能力的整车厂一定会选择自研自动驾驶
蔚来,小鹏创业之初,都找过百度战投,百度开出的条件是必须搭载apollo,虽然缺钱,但是蔚来小鹏都拒绝了,只有威马接受了这个条件。随着特斯拉的市值的暴涨,是个人都明白了卖自动驾驶软件以及车联网生态才是未来整车厂的利润大头,否则不还是4个轮子上的差生意吗?这里也是十分佩服李斌跟和何小鹏眼光长远啊!一旦想明白了第三点,就不难理解百度为何急着自己下场造车了,亡羊补牢,犹是未晚。
下一件事有点争议,但是我觉得是对双方最好的选择
(4)缺乏自研能力的传统整车厂最好选择是收购自动驾驶初创公司
一方面自上而下的方案太烧钱了,除了烧钱还是烧钱,业内对l4的普及是没有时间表的,L3的时间节点大概是2025年。一方面取决于是激光雷达的降价,一方面取决于政策法规的完善。十年不普及就再烧十年下去吗,显然不可能。所以最好的选择就是加入到传统车企的怀抱,降维到自下而上进攻路线吧!这不百度apollo都开始推apollo lite了,相信很快就能把anp推广到威马上。
另一方面传统车企如果完全采购第三方的自动驾驶软件,那么他就少了很大一块利润来源,他也有动力去收购一家自动驾驶初创公司。当然你可以说采购价便宜一点,大家平分利润,存在这种可能性。但软件这种东西,卖1万份跟卖100万份成本是一样的,我觉得量大的整车厂不会对独占这部分利润不感兴趣的,资本是最贪婪的!
那么当下谁最有优势呢?我的答案是——新能源车销量最多,同时内部又在自研自动驾驶的公司。
一,比亚迪是一家,比亚迪新能源车销量连续8年全国第一,比亚迪很低调,很多人可能不知道比亚迪在研发自动驾驶软件。实际上比亚迪在自研算力芯片,内部组建了1000人的智能化团队,21年下半年会官宣。
二,滴滴是另一家,出行市场接近垄断的玩家,别人都在愁数据不够,滴滴简直就是躺在数据堆里发愁的公司,去年滴滴联合比亚迪推出了定制网约车D1,5年内准备生产100万辆,D1收集的数据会与比亚迪共享。滴滴出行也是主力的自上而下自动驾驶软件商之一,有钱有市场,可以坚持到全面胜利的那一天。
三,新势力三雄,虽然量还小,但无疑走在正确的路上,销量也是连月新高,他们也拿到了自动驾驶的门票,争取多卖车吧!
四,百度Apollo,有了高精度地图,未来就有它的一份。自动驾驶上,让传统车企用apollo难了点,但百度亲自下场了呀,威马+自己造车,再差也是技术最强的造车新势力了!
周末花了两天时间整理,拖到周一才发,等更的同学们抱歉啦。本文是基于作者认知的推演,不构成任何投资建议。