唐杉博士:从AI Chip到AI Chiplet

导读

唐杉博士目前任职于壁仞科技研究院。本文是唐杉博士对chiplet的详细解读,希望可以让大家更好的了解chiplet模式。

chiplet是一种新的芯片设计模式,从DARPA的CHIPS项目到Intel的Foveros,都把chiplet看成是未来芯片的重要基础技术。简单来说,chiplet技术就是像搭积木一样,把一些预先生产好的实现特定功能的芯片裸片(die)通过先进的集成技术(比如3D integration)集成封装在一起形成一个系统芯片。而这些基本的裸片就是chiplet。从这个意义上来说,chiplet就是一个新的IP重用模式。未来,以chiplet模式集成的芯片会是一个“超级”异构系统,可以为AI计算带来更多的灵活性和新的机会。

01 chiplet模式简介

chiplet的概念其实很简单,就是硅片级别的重用。设计一个系统级芯片,以前的方法是从不同的IP供应商购买一些IP,软核(代码)或硬核(版图),结合自研的模块,集成为一个SoC,然后在某个芯片工艺节点上完成芯片设计和生产的完整流程。未来,对于某些IP,你可能不需要自己做设计和生产了,而只需要买别人实现好的硅片,然后在一个封装里集成起来,形成一个SiP(System in Package)。所以chiplet也是一种IP,但它是以硅片的形式提供的。

chiplet的概念最早来自DARPA的CHIPS(Common Heterogeneous Integration and IP Reuse Strategies)项目。该项目试图解决的主要问题如下“The monolithic nature of state-of-the-art SoCs is not always acceptable for DoD or other low-volume applications due to factors such as high initial prototype costs and requirements for alternative material sets. To enhance overall system flexibility and reduce design time for next-generation products, the Common Heterogeneous Integration and Intellectual Property (IP) Reuse Strategies (CHIPS) program seeks to establish a new paradigm in IP reuse.”。而它的愿景是:“The vision of CHIPS is an ecosystem of discrete modular, reusable IP blocks, which can be assembled into a system using existing and emerging integration technologies. Modularity and reusability of IP blocks will require electrical and physical interface standards to be widely adopted by the community supporting the CHIPS ecosystem. Therefore, the CHIPS program will develop the design tools and integration standards required to demonstrate modular integrated circuit (IC) designs that leverage the best of DoD and commercial designs and technologies.” 从这段描述来看chiplet可以说是一种新的芯片设计模式,要实现chiplet这种新的IP重用模式,首先要具备的技术基础就是先进的芯片集成封装技术。SiP的概念很早就有,把多个硅片封装在一个硅片里也有很久的历史了。但要实现chiplet这种高灵活度,高性能,低成本的硅片重用愿景,必须要先进的芯片集成技术,比如Intel最近提出的Foveros,3D集成技术。

source: Intel

3D集成技术使我们的芯片规模可以在三维空间发展,而不是传统的限于二维空间。由于在二维空间里,摩尔定律已经很难延续,向三维发展也是一个自然的趋势。此外,正如下图所说的,这种3D集成技术除了提供更高的计算密度之外,还可以让我们重新考虑系统架构(enabling a complete rethinking of system),这个也就是chiplet模式给我们带来的各种新的灵活性,后面再详细讨论。

source: Intel

这里我们不详细讨论3D集成技术的细节,根据目前的发展,在未来几年,相关技术会越来越成熟,应该能够为chiplet模式的普及做好准备。

02 AI chiplet的优势

总得来说,我个人认为chiplet模式对于AI硬件的长期发展会有非常正面的影响,主要体现在下面几个方面。

—工艺选择的灵活性

chiplet模式的最大优势之一就是一个系统里可以集成多个工艺节点的硅片(如下图所示)。

source: Intel

这也是chiplet模式可能支持快速开发,降低实现成本的一个重要因素。大家知道,在芯片设计中,对于不同目的和类型的电路,并不是最新的工艺就总是最合适的。在目前的单硅片系统里,系统只能在一个工艺节点上实现。而对于很多功能来说,使用成本高风险大的最新工艺即没有必要又非常困难,比如一些专用加速功能和模拟设计。如果chiplet模式成立,那么大家在做系统设计的时候则有了更多的选择。对于追求性能极限的模块,比如高性能CPU,可以使用最新工艺。而特殊的功能模块,比如存储器,模拟接口和一些专用加速器,则可以按照需求选择性价比最高的方案。

这一点对于AI芯片的发展是相当有利的。首先,AI加速本身就是一个DSA(专用领域架构),其架构本身就是专门为特定运算定制的,具有很高的效率,即使选择差一两代的工艺,也可以满足很多情况的要求。但目前,大多数这个领域的初创公司,都面临工艺选择的困境。如果选择先进工艺,可能一次投片就耗尽所有投资。如果不选,好像一下就输在了起跑线。如果chiplet模式成为主流,大家的工艺选择应该可以更加理性,工艺虽不是最新但性价比最好的chiplet会有更多机会。第二,对于很多可能大幅提升AI运算效率的新兴技术,比如存内计算,模拟计算(包括光计算),它们使用的器件往往只在相对较低的工艺节点比较成熟,和系统的其它部分怎么集成就是个大问题。chiplet模式也可以解决这个问题,则这些技术的开发商可以以chiplet IP的形式提供产品,和其它不同工艺的功能模块集成在一起,而无需受限于Foundry工艺的进展。

—架构设计的灵活性

以chiplet构成的系统可以说是一个“超级”异构系统,给传统的异构SoC增加了新的维度,至少包括空间维度和工艺选择的维度。首先,如前所述,先进的集成技术在3D空间的扩展可以极大提高芯片规模。这当然对AI算力的扩展和成本的降低有很大好处。第二,结合前述的工艺灵活性,我们可能在架构设计中有更合理的功能/工艺的权衡,有利于AI SoC或者AIoT芯片更好的适应应用场景的需求。第三,系统的架构设计,特别是功能模块间的互联,有更多优化的空间。在目前的AI芯片架构中,数据流动是主要瓶颈。HBM(也可以看成是一种chiplet)可以在一定程度上解决处理器和DRAM之间的数据流动问题,但价格还过于昂贵。对于云端AI加速,Host CPU和AI加速芯片之间,以及多片加速芯片之间的互联,目前主要通过PCIe,NvLink,或者直接用SerDes等等。如果是chiplet方式,则是硅片的互联,带宽,延时和功耗都会有巨大的改善。另外,目前的片上网络NoC是在一个硅片(2D)上的,而未来的NoC则扩展到硅片之间,特别是和Active Interposer结合,就可能成为一个3D网络,其路由,拓扑以及QoS可以有更多优化的空间。

—商业模式的灵活性

chiplet模式在传统的IP供应商和芯片供应商之外,提供了一个新的选择:chiplet硅片供应商。对于目前的AI芯片厂商来说,要么聚焦在AI加速部分,以IP形式或者外接硬件加速芯片的形式提供产品;要么走垂直领域,做集成AI加速功能的SoC。对于前者来说,chiplet可以提供一个新的产品形式,增加潜在的市场,或者拉长一代产品(工艺)的生命周期。对于一些硅实现能力比较强的厂商来说,也说不定未来会演变成专门做chiplet的供应商。对后者来说,可以直接集成合适AI chiplet而不是IP(还需要自己做芯片实现),大大节约项目开发的时间。

因此,可以预见,AI chiplet会成为AI硬件重用和集成的重要模式。

03 chiplet模式的挑战

首先当然是集成技术的挑战。chiplet模式的基础还是先进的封装技术,必须能够做到低成本和高可靠性。这部分主要看foundry和封装厂商。随着先进工艺部署的速度减缓,封装技术逐渐成为大家关注的重点。此外,集成技术的挑战还来自集成标准。回到CHIPS项目,可以看出,该项目的重点就是是设计工具和集成标准。Intel的AIB(Advanced Interface Bus)就是一个硅片到硅片的互联标准,如果未来能够成为业界的标准(类似ARM的AMBA总线标准的作用),则chiplet的模式就可能更快的普及。还有,对于这种“超级”异构系统,其更大的优化空间也同时意味着架构优化的难度也会大大增加。

除了集成技术之外,chiplet模式能否成功的另一个大问题是质量保障。我们在选择IP的时候,除了PPA之外,最重要的一个考量指标就是IP本身的质量问题。IP本身有没有bug,接入系统会不会带来问题,有没有在真正的硅片上验证过等等。在目前的IP重用方法中,对IP的测试和验证已经有比较成熟的方法。但对于chiplet来说,这还是个需要探索的问题。虽然,相对传统IP,chiplet是经过硅验证的产品,本身保证了物理实现的正确性。但它仍然有良率的问题,而且如果SiP中的一个硅片有问题,则整个系统都受影响,代价很高。因此,集成到SiP中的chiplet必须保证100%无故障。从这个问题延伸,还有集成后的SiP如何进行测试的问题。将多个chiplet封装在一起后,每个chiplet能够连接到的芯片管脚更为有限,有些chiplet可能完全无法直接从芯片外部管脚直接访问,这也给芯片测试带来的新的挑战。

最后补充一点,还是那句话,有挑战就有机会。个人认为,除了前面讨论的chiplet模式对普及AI硬件的推动,它还会促进EDA工具的发展。不论是集成技术,还是质量保障,很多chiplet模式的问题最终都需要EDA工具的改进来给出答案,需要EDA工具从架构探索,到芯片实现,甚至到物理设计的全面支持。这也是CHIPS项目的一个重点是设计工具的原因。

(0)

相关推荐

  • 2021年全球半导体行业10大技术趋势

    2020年全球新冠疫情的蔓延和中美在半导体领域的冷战升级虽然对全球经济和半导体产业造成了负面影响,但半导体领域的技术进步却没有止步,有些技术甚至加快了市场商用化进程.ASPENCORE全球分析师团队精 ...

  • Chiplet技术带来的新“四化”

    导读 1958年9月12日,温和的巨人杰克·基尔比(Jack Kilby)发明了集成电路.集成电路发明7年后,Intel创始人戈登·摩尔提出了他的预言式梦想:"集成电路上的器件数量每隔十八个 ...

  • 骁龙765g和骁龙865两款芯片有什么区别?消费者如何选择?

    骁龙765G和骁龙865都是高通旗下比较热门的手机处理器,从高通芯片系列的命名规则中可以看出,如果算上最近高通新发布的骁龙888,骁龙865和765G目前在高通芯片排第三,那就排第四的位置,那么这两款 ...

  • 成立不到一年便实现封装设备国产化零的突破,这家牛逼的公司靠什么打破瓶颈?

    提到半导体设备产业,很多人第一个想到的可能是光刻机.但实际上,封装作为半导体制作过程中的最后一个环节,同样是技术壁垒极高,且长期被欧美日厂商垄断的核心技术. 而这家成立不到一年的公司,就已打破长期被国 ...

  • 小芯片(Chiplet)

    ​小芯片(Chiplet) 芯片库中有一系列模块化芯片可以采用裸片到裸片互联技术集成到封装中.小芯片是3D IC封装的另一种形式,可以实现CMOS器件与非CMOS器件的异构集成.换句话说,它们是封装中 ...

  • 领先高通!华为就是“牛”

    9月6日,华为在德国柏林和北京同时发布新一代旗舰移动平台麒麟990系列,包括麒麟990标准版.麒麟990 5G版(原生集成5G基带,不是外挂)两款芯片.它们的参数区别如下图: 麒麟990 5G版采用最 ...

  • 探寻后摩尔时代 | 看先进封装如何完成“变小”角逐

    " 编者按:过去的半个多世纪,半导体行业一直遵循摩尔定律的轨迹高速发展,如今单纯靠提升工艺来提升芯片性能的方法已经无法充分满足时代的需求,半导体行业也逐步进入了"后摩尔时代&quo ...

  • 先进封装:八仙过海,各显神通

    出于物理极限和制造成本的原因,通过晶体管微缩工艺以实现更高经济价值的逻辑正逐渐变得不再有效.而早在1965年,戈登摩尔就在自己的一篇论文中预测称,"事实证明,使用较小的功能模块(单独封装和互 ...

  • 2021年半导体技术有哪些新看点

    多年来,行业趋势一直聚焦于移动领域,而半导体技术在很大程度上为这些趋势所服务.在过去几年里,对云计算的投资和开发吸引了很多关注,但其中很多都是针对移动性的.   到了2020年,许多人会很高兴地忘记这 ...

  • SiP与Chiplet成先进封装技术发展热点

    来源:中国电子报·作者:陈炳欣· 2020-09-17 17:43 · 4036次阅读 随着摩尔定律面临诸多瓶颈.先进工艺逼近物理极限,业界普遍认为,先进封装会成为下一阶段半导体技术的重要发展方向.长 ...

  • 系统级芯片(SoC)设计选择:内核、IP、EDA和NoC

    系统级芯片(SoC)是一个将计算处理器和其它电子系统集成到单一芯片的集成电路.SoC可以处理数字信号.模拟信号.混合信号,甚至射频信号,常常应用在嵌入式系统中.尽管微控制器(MCU)通常只有不到100 ...

  • 英特尔PK赛灵思,完美胜出!Agilex™ FPGA迎来大规模量产

    英特尔在半导体领域称雄几十年,凭借的就是其x86架构和曾经遥遥领先竞争对手的半导体制造工艺.然而在过去的三四年,英特尔在10纳米工艺上却遇到了阻碍,甚至被曾经望尘莫及的竞争对手完成了弯道超车,并纷纷投 ...