【业内热点】AI SoC互联总线遇瓶颈?那就在芯片内打造一个“互联网”吧

人工智能(AI)与5G技术发展逐渐加快,随之带来了更高的数据交换需求,这种对数据交换的需求不仅体现在系统之间的互联,也体现在芯片内部的互联。在Level4、Level5的自动驾驶中是不需要人来进行操控的,人类将身家性命完全交给半导体来判断之前,确保系统信号回路传输及时、稳定是首先需要解决的问题。而人工智能芯片运算单元丰富,传统总线架构已经成为系统性能的主要瓶颈,芯片内部的互连需要寻求一种新的方式。

“传统总线架构只适合简单架构,下一代芯片,特别是AI芯片,单芯片集成内核数量多,需要互联的模块也更多,我们考虑在芯片内部布一个网,类似互联网那样,替代总线结构,把所有数据用桥接模块分成数据包,用互联网的方法分发出去。” NetSpeed Systems大中华区销售总监黄啓弘将形象地介绍了NetSpeed SoC芯片内部互连解决方案Orion AI。

NetSpeed Systems大中华区销售总监黄啓弘

AI的主要挑战:(1)人工智能工作负载具备独特性,在训练侧和推理侧都需要大型矩阵算法;(2)人工智能架构具备独特性,内核数量多,大量并行结构,点对点通信;(3)带宽要求极高(TB/s),未来对带宽的要求将会更高。NetSpeed推出的Orion AI采用解耦架构,分层堆叠,每层均可扩展或收缩;可编程多播,最早也是目前唯一支持基于广播推送的可配置多播网络IP;服务质量(QoS)非凡,以具备端到端QoS规划的非阻塞路径来控制带宽与延迟。

黄啓弘先生介绍了Orion AI的优势,与传统总线相比,Orion AI方案解除了总线架构带来的数据吞吐量限制,片内带宽可支持到万亿字节每秒(TB/s),接口位宽高达1024位 ,内部结构位宽更高,并可支持高达4K字节的长突发传输;采用先进的低功耗管理技术提升能效;内置人工智能,利用先进人工智能算法,在解决方案空间搜寻最有效的解决方案,可谓是“用人工智能设计人工智能芯片”。

Orion AI由NetSpeed的图灵机器学习引擎提供支持,该引擎使用监督学习来探索和优化SoC设计与架构。Linley Group首席分析师Linley Gwennap表示,这是一种以人工智能为核心的设计方法,“就像有一位随时在线的建筑大师给出设计建议。处理器架构师可以采纳图灵的建议,然后花时间去解决SoC设计中的其他难题。”

NetSpeed的方案能帮助SoC设计公司大幅缩减开发时间。据了解,互连IP成本占整体AI成本的3%-10%左右。NetSpeed的客户通过采用Orion AI,在RTL阶段就可进行互连设计,大幅缩减前端设计与后端设计的试错周期,平均可节约3-4个月时间。据黄启弘介绍,NetSpeed的其中一个客户,特斯拉的自动驾驶芯片从设计到流片只花了大约九个月时间。

除了特斯拉外,NetSpeed目前还有英特尔、亚马逊这些大客户,在国内有地平线机器人、寒武纪、百度等领先的AI公司。

相比其他消费级应用,自动驾驶应用对安全等级有更高的要求,Orion AI通过了ISO 26262标准,可支持ASIL D级别安全要求,采用Orion AI来进行SoC互联设计也更容易达到汽车应用的安全要求。

NetSpeed是一个以技术为本的公司,虽然是个年轻的公司,但成立8年以来,已经申请了130多项专利。NetSpeed除了为大客户提供定制化的IP服务,还提供非加密的互连IP,在授权模式和费用上都可根据中国客户需求进行灵活调整。目前我国AI应用迅速发展,NetSpeed拥有极佳的市场机遇,NetSpeed提供的更方便、可靠的设计建议也使得AI芯片设计工程师拥有了更多的选择。

 

(0)

相关推荐

  • 到底什么是Cortex、ARMv8、arm架构、ARM指令集、soc?一文帮你梳理基础概念【科普】

    前言 有粉丝问我到底什么是ARM,搞不清楚Cortex.arm内核.arm架构.ARM指令集.soc这些概念都是什么关系,下面一口君给大家整理一下关于ARM相关的一些概念. 1.ARM既可以认为是一个 ...

  • 系统级芯片(SoC)设计选择:内核、IP、EDA和NoC

    系统级芯片(SoC)是一个将计算处理器和其它电子系统集成到单一芯片的集成电路.SoC可以处理数字信号.模拟信号.混合信号,甚至射频信号,常常应用在嵌入式系统中.尽管微控制器(MCU)通常只有不到100 ...

  • IC设计及验证将迎来颠覆性改变

    日前,Mentor IC EDA 执行副总裁 Joseph Sawicki 来到中国,参加一年一度的Mentor Forum 2019北京设计技术论坛.Sawicki在Mentor工作近30年,曾经领 ...

  • 人工智能设计芯片,比你想象的更大胆

    机器将能够在容错边际上更加激进大胆,它可以比人类更好地计算赔率. 来源丨ZDNet 作者丨Tiernan Ray 编译丨科技行者 AI(人工智能)技术正在越来越多地被应用于半导体设计之中,这种做法的优 ...

  • 面向人工智能的芯片IP核设计

    深度学习算法和神经网络处理的最新创新正在激发对人工智能芯片的新技术需求.面向视觉.语音.情境感知.一般数据模式识别等的深度学习功能正在添加到各个市场上的SoC中.Synopsys DesignWare ...

  • ASIP:人工智能芯片的新门类、少数派

    编写丨张曙东一.关于人工智能芯片的分类1.云天励飞招股说明书及问询回复材料的分类深度神经网络处理器芯片以GPU为代表,进一步提高云端芯片算力,将终端采集到的海量数据传输回云端的运算中枢进行处理,重视产 ...

  • 新旗舰比预期来得早,联发科已准备好向5G进军

    "今天的发布会还有一点时间,因此我们也可以在最后给大家分享一个彩蛋,那就是OPPO将于明年上半年首发基于联发科天玑1000的高端手机." 2019年12月26日,沈义人在OPPO ...

  • 【博文连载】奔跑吧,SOC(三)——互联总线协议

    之前,说了片上互联总线,但是光有总线可是不行的,还需要片上总线协议支持才行,因为有了协议,才能对寄存器准确无误的进行操作. 说到片上总线协议,那可就多了,如ARM公司所用的AMBA总线,Silicor ...

  • 【博文连载】奔跑吧,SOC(二)——片上互联总线

    之前说明了软件控制硬件的原理,本质上就是控制寄存器.但是软件也只能控制一个寄存器,那如果要控制多个寄存器了,那又该怎么办呢?这个时候,你就得了解片上总线互联技术了,为什么是片上了,因为这些都是在芯片里 ...

  • 【业内热点】eFPGA又有大更新,Achronix 专为AI / ML应用推出Speedcore Gen4 eFPGA IP

    随着人工智能(AI).机器学习(ML)等对数据处理能力要求的提升,处理器核心数量的倍数增加并不能带来计算能力的倍数增加,嵌入FPGA的SoC则可以带来更快数据处理能力,同时功耗也更低. 近日,基于现场 ...

  • 热点前瞻:互联金融+证券、银行+油气改革+元器件

    热点一:互联金融 逻辑概述:发布<关于加强P2P网贷领域征信体系建设的通知>,将组织辖内在营的P2P网贷机构接入金融信用信息基础数据库运行机构.百行征信等征信机构,目前我国征信系统已成为世 ...

  • 临帖遇瓶颈?

    临帖是学习书法的唯一途径.书家以它为日课.以期融会贯通,自成风格:初学者更是以它为基石,以期厚积薄发,技进乎道.可在临帖过程中我们都有这样的体会,即拿到一本字帖,通过一段时间的临写之后,有时会出现停滞 ...

  • 临帖遇瓶颈?四招教你调整好!

    临帖是学习书法的唯一途径.书家以它为日课.以期融会贯通,自成风格:初学者更是以它为基石,以期厚积薄发,技进乎道.可在临帖过程中我们都有这样的体会,即拿到一本字帖,通过一段时间的临写之后,有时会出现停滞 ...

  • 电池能量密度遇瓶颈?CATL/BYD/蜂巢能源等“苦修内功”

    近日,有消息称宁德时代即将放弃811 电芯,将内部研发重心转向"523"体系.宁德时代随后对此进行了辟谣.  其后又有媒体报道,已有广汽新能源Aion S车主反映,4S店称将对其购 ...

  • “高手”会遇“瓶颈”|写作班作品点评版

    导语         这是我收到谢瑞熙的第2篇短文.在2篇"短文"之前,她的文章基本上是千字左右,如果是自创童话,一般都要1200~2000字.她是2年级下学期开始接受我的写作培训 ...

  • 探索与实践:自主游戏发展遇“瓶颈”,打破僵局还是保持现状?

    幼儿教育是教育工作中最基础的环节,打好幼儿教育基础对今后的教育工作有着至关重要的作用.而在幼儿教育过程中,自主游戏建设是其重要的组成部分,<幼儿园工作规程>和<3-6岁儿童学习与发展 ...