AI原生芯片

我们都知道,全球芯片制造企业中,制程工艺最先进的,就是台积电。过去几年,台积电最大的客户就是苹果,占到了年度营收的20%以上。

既是自己的第一大客户,而这个客户还非常愿意尝试最新的制程工艺;因此,当台积电量产10纳米、7纳米、5纳米的时候,苹果始终都是最早尝鲜的那个。

如今,这个“国际惯例”似乎要被打破了。据外电报道,台积电3纳米或将于明年7月量产,而率先引入的客户会有两家,一家是英特尔,另一家则是Graphcore。

英特尔咱们以后再说,先说这家Graphcore,其实是一家成立仅仅6年时间的英国公司。也是在今年,这家公司获得了E轮融资,估值高达27.7亿美元,也是西方国家里唯一的半导体行业“独角兽”(估值超过10亿美元的未上市公司)。

那么,为什么Graphcore这么值钱?老冀仔细琢磨了一下,想出了一个理由:因为Graphcore是一家“AI原生”的芯片设计公司,只有它设计的IPU(Intelligence Processing Unit),从一开始就是为了AI(人工智能)而生的。

说到AI,大家应该也能够感觉到,经历了数字化浪潮之后的我们,即将进入智能化时代。未来,越来越多的企业、消费者、地方、场景都会用到AI。最近老冀就看到了一个新闻,全球领先的新能源电池生产商宁德时代,就与AI公司第四范式达成战略合作,要让AI系统与现有生产系统对接,实现对生产线数据的实时分析与决策。

AI应用的过程一般可以分为训练和推理,哪个阶段都离不开强大算力也就是芯片的支持。以AI训练为例,要满足其不断增长的需求,一方面需要不断提升芯片的计算能力,另一方面可能大家就知道得比较少了,那就是还需要不断提升存储容量和带宽,这是因为在AI训练的过程中需要存储大量的中间激励函数。

可是,目前用于AI训练的主流芯片——GPU,当初是为了大规模并行计算而开发的,那个时候还没有大规模AI计算的需求,这也导致其在做AI训练的时候存在短板。

其中一个比较大的短板,就是“存储墙”。简单来说,无论是CPU还是GPU,它的计算单元与大部分的存储单元是分开的,而要完成一个复杂的AI训练,就需要在计算单元和存储单元之间频繁地、大批量地传输数据。可是,最近这些年数据传输的提升速度,远远赶不上计算能力的提升速度,这就导致AI训练卡在了这个瓶颈上。

Graphcore想出了办法解决这个瓶颈,它设计的第一代IPU拥有高达1216个核,每个核里都集成了计算单元和内存,使得单个IPU的存储带宽达到了45TB,比性能最快的HBM还提升了50倍以上。而且,由于避免了频繁访问外部存储,在相同算力下,IPU的功耗还降低了一半。

正因为IPU解决了AI计算的痛点,2019 年,Graphcore的IPU一经推出,立即获得了微软、戴尔、Uber、DeepMind(曾经发布过击败人类所有围棋大师的AlphaGo的那家大神级AI公司,如今已经归于Google旗下)等科技巨头的青睐,因为它打破了AI处理能力的瓶颈。

老冀看到微软公司研究员Sujeeth Bharadwaj曾经表示,微软曾经用AI来读取X光胸片并诊断肺部病症。一开始AI训练用的是最高端的GPU,结果花了5个小时;改用Graphcore的IPU之后,只用了半个小时就搞定。

不过,鉴于IPU要集成这么多的核,还要把计算单元和内存“攒”在一起,这就导致了非常复杂的芯片内部结构,也让IPU成为了当前最复杂的处理器芯片。2020年7月,Graphcore发布了第二代IPU GC200,它采用了台积电7纳米工艺,晶体管数量高达594亿个,比两个月前NVIDIA发布的安培架构GPU A100的晶体管数量还要多出10%。

这么复杂的芯片,当然是制程工艺越先进,越能够缩小裸片面积,越能够降低功耗。因此,虽然台积电最先进的3纳米工艺还没有量产,Graphcore却已经急吼吼地找上门来。对于台积电来说,也是非常乐于接受像Graphcore这样的新鲜客户,一来能够帮助检验制造工艺的可靠性,二来说不定将来Graphcore能够长成像苹果、AMD、高通那样的大客户呢?

不过,如果IPU能够在AI领域成为主流的话,GPU的地位就将动摇,这也许会影响到GPU老大NVIDIA的江湖地位。要知道,正是因为赶上了AI的风口,NVIDIA的市值才得以超越领跑几十年的英特尔,成为芯片行业新的领袖。

要知道,Graphcore与NVIDIA还有一笔旧账要算,它的两位创始人 Nigel Toon 和 Simon Knowles曾经创办过一家名为Icera的芯片公司,并在2011年被NVIDIA收购。他们两人从NVIDIA离职之后,才在2016年创办了Graphcore。由于在NVIDIA工作过一段时间,他们对于GPU在AI计算中的优点和缺点都门清。

Graphcore的早期投资人,同时也是ARM公司的联合创始人Hermann Hauser曾经有过一个著名的论断:在计算机的计算架构上,历史上一共只发生了三次革命,第一次革命是上个世纪 70 年代的 CPU,第二次革命是上个世纪 90 年代的 GPU,第三次革命则是2019年横空出世的IPU。他的论断会成为现实吗?

(0)

相关推荐