一张晶圆仅做一颗芯片,良率100%?史上最大芯片更新至第二代
IC人有奖问卷调查(无记名)实时抽奖,600份好礼!
Cerebras Systems 表示,WSE 系列处理器是针对人工智能运算客制化产品,WSE2于第一代一样,芯片面积近乎于整张12吋晶圆,达到了4.6万mm 2 但采用了台积电7 纳米制程的WSE-2处理器拥有2.6 万亿个晶体管和85万个人工智能最佳化内核,为首代WSE 处理器的两倍多。Cerebras还引用了1000倍的板载内存,带有40 GB的SRAM,而Ampere A100则为40MB。
这些核心用带有FMAC数据路径的二维网连接。Cerebras通过设计一个可以绕过任何制造缺陷的系统来实现100%的良率--最初Cerebras有1.5%的额外内核以允许缺陷的存在,但后来被告知这太多了,因为台积电的工艺已经非常成熟。
Cerebras与WSE的目标是提供一个单一的平台,通过创新的专利设计,允许在人工智能计算中有用的更大的处理器,但也已经扩展到更广泛的HPC工作负载。
建立在第一代WSE之上
该设计的一个关键是自定义图形编译器,它采用pyTorch或TensorFlow,并将每一层映射到芯片的一个物理部分,允许在数据流过时进行异步计算。拥有如此大的处理器意味着数据永远不必离开芯片而在内存中等待,从而避免了浪费功耗,并且可以以流水线的方式不断进入计算的下一个阶段。编译器和处理器的设计也考虑到了稀疏性,无论批次大小,都可以实现高利用率,或者可以使参数搜索算法同时运行。
对于Cerebras的第一代WSE是作为一个完整的系统出售的,称为CS-1,该公司已有几十个已部署的系统正在运行,包括一些研究实验室、制药公司、生物技术研究、军事以及石油和天然气行业。劳伦斯·利弗莫尔(LawrenceLivermore)有一个CS-1与它的23 PFLOP 'Lassen'超级计算机相配。匹兹堡超级计算机中心用500万美元的拨款购买了两套系统,并将这些系统连接到其Neocortex超级计算机上,从而实现了同步AI和增强型计算。
产品和合作关系
目前,Cerebras销售的完整CS-1系统是一个15U的盒子,包含一个WSE-1以及12x100GbE、12个4千瓦的电源(6个冗余,峰值功率约23千瓦),在一些机构的部署是与HPE的SuperDome Flex搭配。新的CS-2系统也有这样的配置,尽管核心数增加了一倍多,板载内存也增加了一倍,但仍在相同的功率范围内。与其他平台相比,这些处理器在15U的设计中是垂直排列的,以便于访问,并在如此大的处理器上内置液体冷却。
Cerebras设计的独特之处在于能够超越通常在制造中呈现的物理制造极限,即所谓的网纹极限。处理器在设计时将这一限制作为芯片的最大尺寸,因为用交叉网纹连接两个区域很困难。这是Cerebras带来的秘诀的一部分,该公司仍然是唯一一家提供这种规模的处理器的公司--Cerebras开发并获得的构建这些大型芯片的专利在这里仍然发挥作用,第二代WSE将被构建在CS-2系统中,在连接和视觉方面的设计与CS-1相似。
同样的编译器和软件包的更新使任何使用第一个系统试验AI工作负载的客户能够在部署第二个系统时使用。Cerebras一直致力于更高层次的实现,使拥有标准化TensorFlow和PyTorch模型的客户能够通过添加三行代码并使用Cerebras的图形编译器,非常快速地同化他们现有的GPU代码。然后,编译器将整个85万个内核分成各层的片段,使数据流以流水线的方式不停顿的进行。该芯片还可以同时用于多个网络的参数搜索。
作为一家公司,Cerebras在多伦多、圣地亚哥、东京和旧金山拥有约300名员工。首席执行官Andrew Feldman表示,他们已经开始盈利,已经有几十家客户部署了CS-1,还有更多的客户已经在远程试用CS-2,他们正在开发商业系统。除了人工智能,由于芯片的灵活性可以实现流体动力学和其他计算模拟,Cerebras也从典型的商业高性能计算市场获得了极大关注,比如油气和基因组学。CS-2的部署将在今年第三季度晚些时候进行,价格已经从200万到300万美元上涨到几百万美元。
来源:EETOP综合编译自businesswire、anandtech