深读 | 特斯拉AI技术体系的灵魂是什么?

人工智能落地的野心和现实,显然还存在着不小的鸿沟。


文 | 彭苏平

特斯拉不仅仅是一家汽车制造公司,而且是一家科技公司。上周的一场发布会,让特斯拉的这种形象更加鲜明。

北京时间8月20日上午,预热多时的特斯拉AI日活动如期举行。特斯拉发布了FSD(完全自动驾驶)纯视觉解决方案、自研AI芯片和Dojo超级计算机,其披露的更多技术细节以及相关硬件更为快速的技术迭代,让业内再次惊叹“特斯拉的技术是真的很牛”。

不过,对于长期关注特斯拉的人而言,无论是纯视觉解决方案还是自研AI芯片和Dojo超算,都算不上是“大新闻”,最令人吃惊的,实际上是一个“彩蛋”:特斯拉宣布即将推出类人机器人,也就是所谓的Tesla Bot。

对于人工智能技术,马斯克显然还有更远大的追求。8月21日,清华大学人工智能研究院视觉智能研究中心主任邓志东对智库君表示,无论是FSD还是消费级的个人机器人,核心都是AI,而自动驾驶、个人机器人这两大应用场景,在未来经济社会发展中都具有颠覆性,也蕴含了巨大的产业发展空间。

不过,整体而言,当前人工智能在产业界的应用还不尽如人意。即便是特斯拉,它的自动驾驶技术尽管在业内已经比较领先,但仍然远未成熟,目前仅处于还需要人为监管的辅助驾驶阶段,近期,其辅助驾驶功能上的一些缺陷更是引发了广泛关注。

人工智能落地的野心与现实,显然还存在着不小的鸿沟。


特斯拉AI技术体系的灵魂

“特斯拉的AI能力,其技术迭代之快,至少是目前全世界其他新、老车企所不具备的。这为自动驾驶与个人机器人的应用落地与产业发展,提供了更大的预期。”邓志东对智库君表示。

在AI日活动上,特斯拉向外界展示了其在AI领域的各项成果,包括纯视觉方案FSD的进展、神经网络自动驾驶训练、D1芯片、Dojo超级计算机等等。其中一项重头戏便是纯视觉方案FSD的进展。

与业内绝大多数自动驾驶解决方案供应商的技术路线不同,特斯拉一直坚持纯视觉方案,通过摄像头进行环境感知,不用激光雷达,也不用高精地图。相对来说,这种方案的硬件成本相对较低,但对数据和算法的要求更高。

发布会上介绍的方案显示,特斯拉通过8个环绕全车身的摄像头获取道路周边信息,并通过多任务的神经网络架来拼接不同的图像。为了让拼接出的信息更逼真、更有参考价值,特斯拉开发了一套技术,可以通过摄像头的信息绘制3D鸟瞰图,并形成4D的空间和时间标签的“路网”以呈现道路等信息,帮助车辆更精准地把握驾驶环境。

上述过程,在自动驾驶中的专业术语是感知,而感知仅仅是自动驾驶核心技术中的一项。有了海量数据基础之后,还需要建立一个强大的神经网络,对这些数据进行整合和重新分析。

邓志东指出,对于神经网络大模型,通常需要大数据、大算力的“暴力”支撑,在自动驾驶赛道,特斯拉基于众包的互联网思维,以首创的影子模式获得了最大规模的真实道路交通大数据,而这次发布会也展示了特斯拉在自动驾驶仿真或数字孪生系统上的成果。

据介绍,特斯拉建立了一个1000人规模的数据标注团队,结合人工的细腻与机器的高效,对物体信息进行标注。同时特斯拉还开发了仿真场景技术,模拟现实中不常见的“边缘场景”,来提升神经网络的培训效率。

“这方面的工作不仅可以获得更大规模的合成数据,而且对基于深度强化学习的决策规划研究,对应用落地之前如何解决长尾问题、边缘小概率事件等,都具有特别重要的意义。”邓志东表示。

随着所需处理的数据开始呈指数级增长,特斯拉也在提高训练神经网络的算力,因此,Dojo超级计算机诞生。实际上马斯克此前已经多次“剧透”过Dojo超级计算机的存在,这次AI日发布的,更引人注目的是组成Dojo超级计算机的关键单元——特斯拉自主研发的神经网络训练芯片——D1。

早在2019年4月特斯拉就量产了自研的FSD芯片,这次展示的D1芯片,在架构与性能上都有了大幅度升级。据称,D1芯片采用分布式结构和7纳米工艺,搭载了500亿个晶体管、354个训练节点,仅内部的电路就长达17.7公里,实现了超强算力和超高带宽。

而Dojo超算,原来是由5760块英伟达的A100显卡构建,而现在则完全改成了自研,由3000 块D1 芯片或120个训练单元组成,总算力达到了9PFLOPs(9千万亿次),能够适应海量视频大数据,实现AI大模型训练。

马斯克曾表示,最终会将Dojo超算提供给希望使用它来训练神经网络的其他公司,这意味着,特斯拉有可能将AI应用扩展到自动驾驶之外的其他领域,这次亮相的机器人便在一定程度上证实了这个可能性。

据悉,Tesla Bot高1.72米,重56.6千克,脸上的屏幕可显示信息,拥有人类水平的双手,并有力反馈感应,能够实现平衡和敏捷的动作——它就将利用Dojo超级计算机的训练机制来改进功能。

马斯克表示:“未来劳动力不会短缺,但体力劳动只是一种选择。Tesla Bot可以执行一些危险性、重复性、枯燥的任务。”这个项目已经提上日程,按照计划,Tesla Bot或将在明年推出首个原型机。

邓志东指出,目前的AI,可以对产业赋能的实际就是具有学习能力的数据智能,或者说大规模的神经网络,从AI算法来看,特斯拉显然抓住了多摄像头视觉神经网络这一核心架构,力图通过神经网络固有的学习能力,来解决自动驾驶甚至是个人机器人场景的一切问题。

“用自主学习来解决感知、预测与规控等挑战,可以充分发挥机器超越人类的能力,这是特斯拉AI技术体系的灵魂,也是特斯拉在理念上最领先的地方。”邓志东指出。

AI落地仍存挑战

此次“秀肌肉”,特斯拉的目的是为了招揽AI领域更多的专业人才。

尽管特斯拉是自动驾驶行业一定意义上的“领头羊”,但其距离真正的无人驾驶也还有很长一段距离,即便是现在已经落地的辅助驾驶功能,也并未做到尽善尽美。从这个角度看,AI技术进一步发挥作用还有待进一步完善。

近期,美国国家公路交通安全管理局(NHTSA)启动了对特斯拉的调查。据悉,NHTSA调查的11起事故均与特斯拉的Autopilot(自动辅助驾驶)或其他自动驾驶功能有关,其中,7起事故造成了人员伤亡,共计17人受伤和1人死亡。

具体而言,这些事故发生在2018年1月22日至2021年7月10日之间,横跨九个不同的州。它们大多发生在晚上,事故后的场景中都有一些诸如急救车灯、照明弹、发光箭头板和路锥等物体——从场景上看,在道路救援人员停下车辆实施救援任务的时候,特斯拉的自动辅助驾驶功能未能成功识别到这些物体和车辆,进而发生碰撞。

上汽集团技术中心的一位规控工程师在分析该类事故原因时指出,锥桶+静止异性车辆是个典型的边缘场景,单纯摄像头甚至是摄像头+毫米波雷达的传感器组合都很难覆盖到这个场景。“首先,锥桶形状比较小,远距离下毫米波雷达很难扫到,静止目标(包含车辆)则很容易被过滤掉。而摄像头如果没有针对的训练,无法识别出障碍物也会变成睁眼瞎。即使距离驶近后识别到了车辆,也因为高速近距离而无法避免碰撞。”

坚持纯视觉方案的特斯拉,尽管已经部署了摄像头训练的方案,但显然至今并未解决这个问题。对于特斯拉而言,这种功能上的缺陷需要尽快处理,这必然需要其进一步壮大AI相关的团队,这次发布会详细地展示其技术路径与储备,特斯拉便是在向志同道合的行业人士抛出橄榄枝。

站在特斯拉的角度,公司的掌舵者马斯克现在展示了更大的野心。这次发布会上亮相的人形机器人显示,特斯拉不仅要做一个具备自动驾驶能力的智能汽车公司,而且要做一个覆盖更多面的人工智能机器人公司,这对特斯拉相关技术团队的搭建和储备提出了更高的要求。

从中观的视角来看,近年来,全球人工智能行业取得快速发展,人工智能企业的数量和融资水平高速增加,围绕人工智能产业的人才竞争已经愈发激烈。

亿欧智库的一份报告显示,在过去10年中,全球主要国家新增AI企业数量在2016年左右达到峰值,其中,中国和美国新增AI企业数量在2017年后绝对值仍然大幅度领先于其他国家,是全球AI企业领先地区;从引入资金的角度来看,全球AI企业融资数量持续增长,在2016年以后呈现出几何级增长趋势,至2018年全球AI企业共计融资784.8亿美元,其中美国居首。

而AI人才长期以来是严重的供不应求状态。多个研究机构曾发出报告,全球各地AI工作岗位都存在巨大的缺口。据美国AI机器处理自动化技术研发商UIPath推出的《AI Jobs》报告,美国在2018年有7465个相关职位空缺;加拿大Element AI的首席执行官JF Gagne发布的2019全球AI人才报告也显示,全球AI人才库正在增长,但需求仍然超过供给,最新的2020全球AI人才报告则显示,尽管去年相关需求有一定下降,但对于“新角色”的需求却一直稳定。

JF Gagne发布的最新报告指出,人才是AI发展的掣肘,而现阶段的AI行业需要的还不仅仅是掌握软件算法的人才。“AI的全部潜力是否被过度炒作还有待讨论,但我们可以说, AI真正获得成功不仅仅需要高级专家以及正确的数据算法。AI行业最初专注于非常高级的专家,因为只有他们才能管理新技术,并将其应用于新领域。但现在人们认识到,这项新技术需要的不仅仅是工程师和能够构建良好模型以有效部署它的人员。”

该报告进一步解释,AI是新一代软件,它是用数据而不是逻辑规则编码的,相比之下,传统软件是静态的,AI则需要一个新的基础设施生态系统,不仅要构建,还要在部署后进行治理,因此,为了让AI大规模发挥作用,工程、基础设施建设、新业务模式开发和目标监控等领域都需要大量的新人才。

(0)

相关推荐