[科普]异构计算在自动驾驶中的应用

随着自动驾驶作为汽车行业发展趋势以及相关芯片引起高度重视,一下子异构计算芯片成为了行业热点。很多朋友对什么是异构计算芯片很感兴趣,跟着小星详细了解一下异构计算的技术细节、未来趋势和在汽车自动驾驶中的应用吧。

什么是异构计算

↑异构计算架构灵活性和效率

异构计算“Heterogeneous Computing”是一种特殊的并行分布式计算系统。它能够经济有效地实现高计算能力,可扩展性强,能够非常高效地利用计算资源。与之相对的概念就是同构计算“Homogeneous Computing”,也就是为大家熟知的多核理念。为了突破计算算力受制于功耗的瓶颈,多核CPU技术得到越来越多的应用。强大的CPU采用越来越多的CPU内核这就是传统同构计算系统。很快人们就发现在AI人工智能和自动驾驶爆炸式增长的计算需求下,传统同构计算系统已经无法满足要求,GPU、DSP、FPGA和ASIC由于特定需求下高效性越来越多的被应用。而异构计算技术应运而生,像一个大厨将CPU、GPU、DSP、FPGA和ASIC这些优良食材制成一道融合各方口味特点的佳肴。

↑自动驾驶的异构计算系统需求

比如自动驾驶中的摄像头视觉图像处理的计算需求为例,它分为图像获取、特征抽取、特征处理、模式识别和动作反馈等步骤。其中对大量图像数据的高速并行实时处理比如像素处理、图像金字塔和梯度检测等需要GPU和ISP图像信号处理器这样专用内核来高速计算。而DSP和专用加速器则偏向卷积或傅里叶等数学计算加速,CPU更倾向通用计算和复杂动作反馈决策。依托异构计算技术能够整合这些不同架构的内核到单一芯片中从而适配自动驾驶的复杂计算要求。

其实现在的AI芯片越来越像人脑,而人脑本身就是典型的异构架构。左脑负责语言和逻辑,右脑负责情感和创造,小脑负责运动和应激反应,各有分工且都不可或缺。

异构计算芯片典型案例

↑异构计算芯片苹果M1

那么到底什么样的芯片是典型的异构计算芯片呢?

让我们来举个例子。苹果最新款的Mac Book Air采用了自研芯片苹果M1替代传统的CPU、DDR4内存、IO接口芯片、苹果T2加密芯片和雷电Thunderbolt接口控制芯片的诸多功能。苹果M1集成了8个CPU内核、8个GPU核心和16个神经网络加速引擎。并且这些不同架构的内核可以通过标准内存访问架构UMA进行高速数据共享。是异构计算技术使得如此多不同类型的计算核心可以高效协同。苹果M1以优异的性能功耗比开创了自研异构计算芯片在笔记本电脑市场商用的先河。

异构计算在自动驾驶中的迭代

↑摄像头采集图像进行分层学习

特斯拉等车厂率先实施人工智能的驾驶辅助系统。其中人工智能的核心技术为深度学习Deep Neural Networks (DNN)。通过对摄像头采集图像进行分层学习,从图像中可以抽取相应的目标位置,路线规划。从而通过深度学习,规划出的路径不再完全依靠车道线,而是基于对于前方目标辨认标识出的安全空间。

↑奥迪自动驾驶控制器zFAS

而自动驾驶控制器当中的计算平台为了实现人工智能的需求,实际上有一个迭代演进的过程。我们以率先量产L3自动驾驶的奥迪A8L为例。其自动驾驶的核心自动驾驶控制器zFAS采用了大量不同架构的计算芯片实现1个激光雷达、5个毫米波雷达和3个摄像头的信号处理和决策。等效算力在2TOPS左右。其核心处理器包括

-Tegra K1 来自 NVIDIA,用于人工智能机器学习

-Aurix 来自 Infineon,用于提供符合功能安全和信息安全的驾驶辅助管理

-Cyclon V 来自 Altera,用于基于FPGA技术高速处理信号融合

-EyeQ3来自Mobileye,,用于进行视觉信号处理

↑特斯拉Autopilot2.0域控制器CCM中央计算模块

特斯拉演进至Autopilot2.0则将驾驶辅助的控制都合并到了CCM中央计算模块当中。CCM就像车载的强力大脑,它高速处理1个毫米波雷达和8个摄像头信号,算力提升至10TOPS。但它仍采用分立的SOC和GPU架构,包含如下组成部件:

-Parker SOC + Pascal GPU 来自 NVIDIA,用于人工智能机器学习

-Aurix 来自 Infineon,用于提供符合功能安全和信息安全的驾驶辅助管理

-Ethernet Switch 来自 Marvel,用于基于以太网技术的高速信号交互

↑特斯拉Autopilot3.0域控制器采用自研异构芯片FSD

而迭代至Autopilot3.0可以说是自动驾驶中央计算模块的分水岭和里程碑。因为采用自研异构芯片FSD,使得芯片内部集成了3个四ARM A72 CPU核心加GPU和2组神经网络处理单元NPU。它能更高速且低能耗地处理1个毫米波雷达和8个摄像头信号,系统算力大幅提升至144TOPS。这其中异构计算架构功不可没。

↑英伟达自动驾驶异构芯片

作为通用图形处理单元GPU领军者英伟达NVIDIA很快意识到了深度学习神经网络DNN在自动驾驶中的崛起和应用挑战。从而基于异构计算架构推出了一系列定制的SOC芯片。比如小鹏P7采用的Xavier芯片算力为30TOPS,它具有强大的八核ARM64处理核心和512核Volta GPU,并且能够达到汽车安全所需要功能安全ASIL-D(最高等级)的级别。相对整车级别优化了功耗性能比。而即将量产的蔚来ET7配备了ADAM超算平台,算力达到1016TOPS。ADAM超算平台采用了4组英伟达最新的Orin自动驾驶异构计算技术SOC芯片。每组Orin芯片集成了12个ARM A76 CPU核心和算力在200TOPS左右的GPU内核。

↑英伟达异构计算软件架构CUDA

有了优秀的异构计算架构组成的芯片,还需要能够高效协调异构芯片中不同类型计算核心的软件架构才能让自动驾驶如虎添翼。为此英伟达开发了专用的异构计算软件架构CUDA,而其他厂商则抱团组成异构计算软件联盟并推出了相应的OPENCL软件架构。有了高效的软件平台,广大的开发者能够快速的将人工智能算法适配到相应的硬件计算资源,这是异构技术技术在自动驾驶领域高速发展的关键。

综上所述,依托异构计算技术能够整合CPU、GPU、DSP、FPGA和ASIC不同架构的内核到单一芯片中从而适配自动驾驶的复杂计算要求。而自动驾驶也经历了从复杂分立到高度集成异构计算芯片方案的演进。基于异构计算技术不仅系统算力更强,而且定制的软件架构能够加速自动驾驶算法快速高效的适配。希望今天小星的介绍能让大家对异构计算相关技术细节有个深入的了解。

(0)

相关推荐

  • 射月之旅:深度解析英特尔Xe GPU架构

    这样就不会错过老石的每一篇推送了 8月19日,英特尔举办了一年一度的架构日(Intel Architecture Day 2021).在这场两个多小时的活动里,英特尔详细分享了包括Alder Lake ...

  • 什么是DPU,市场有多大?

    通过收购,NVIDIA 进入数据处理单元 (DPU) 市场将近一年,DPU 是部署在数据中心以加速工作负载的芯片.这家芯片制造商宣布了一系列令人印象深刻的合作伙伴和客户,他们要么将其 BlueFiel ...

  • 英特尔的路,走宽了

    出品 21ic中国电子网 付斌 网站:21ic.com 从IDM到IDM 2.0,从异构计算到超异构计算,英特尔作为一家以数据为中心的企业,是唯一能够颠覆行业概念,也是唯一有底气可以重新定义概念的企业 ...

  • 能效提升3倍,登临科技展示国内唯一量产GPU实力

    机器之心报道 机器之心编辑部 AI 时代应该构建什么样的 GPU?这家创业公司给出了自己的答案. 去年 5 月,1750 亿参数的超大预训练模型 GPT-3 让世人惊艳,AI 模型体量大规模增长之后产 ...

  • 神经网络芯片现状(CPU、GPU与NPU)

    AI芯片主要有传统芯片和智能芯片两类.传统芯片可以实现人工智能所需的基本运算操作,但是由于传统芯片为通用计算设计,所以架构.性能等方面无法适应AI的快速发展与海量运算.CPU在计算机的发展进程中,CP ...

  • Intel又到了壮士断腕、战略转型的时刻!

    ⬆︎ 点蓝字关注 全球风口 丨 你的全球科技前哨侦察兵 你好,我是王煜全,这里是王煜全要闻评论. 今天我们的话题是Intel.这家长期处于芯片行业主导地位的公司,今年过得不太好,尤其第三季度每股收益未 ...

  • 英伟达推出ARM架构CPU,意图何在?

    ⬆︎ 点蓝字关注 全球风口 丨 你的全球科技前哨侦察兵 你好,我是王煜全,这里是王煜全要闻评论. 4月13日,英伟达创始人黄仁勋在GTC2021,发布了三款基于ARM架构的处理器.尽管英伟达收购ARM ...

  • 自动驾驶中的深度学习

    干货第一时间送达 最早使用神经网络来检测车道线,分割地面和驾驶的自动驾驶汽车叫 ALVINN,创建于1989年. Autonomous Land Vehicle In a Neural Network ...

  • 自动驾驶中高效的激光雷达里程计

    标题:Efficient LiDAR Odometry for Autonomous Driving 作者:Xin Zheng, Jianke Zhu, Senior Member, IEEE 排版: ...

  • 自动驾驶中的交通标志识别原理及控制应用

    自动驾驶中的交通标志识别原理及控制应用

  • 自动驾驶中激光雷达检测障碍物理论与实践

    激光雷达是利用激光束来感知三维世界,通过测量激光返回所需的时间输出为点云.它集成在自动驾驶.无人机.机器人.卫星.火箭等许多领域. 本文从自动驾驶汽车的角度解释它是如何工作的,然后将探讨如何处理点云, ...

  • 自动驾驶中图像与点云融合的深度学习研究进展综述

    文章:Deep Learning for Image and Point Cloud Fusion in Autonomous Driving: A Review 作者:Yaodong Cui, IE ...

  • 自动驾驶中车辆的如何使用点云定位?

    标题:Review on 3D Lidar Localization for Autonomous Driving Cars 作者:Mahdi Elhousni and Xinming Huang 翻 ...

  • 自动驾驶中激光雷达点云的论文

    自动驾驶中激光雷达点云的论文

  • 自动驾驶中的3D物体状态检测

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 摘要 3D物体检测是自动驾驶的一项重要技术,KITTI提供了一种用 ...

  • 知荐 | 聊聊自动驾驶中的功能开发

    资料来源:知乎(躲在钢琴里的猫) 在知乎上看过不少大牛写的自动驾驶技术介绍文章,大多谈到的是AI, Deep Learning, Computer Vision等等感知(Perception)层面的. ...