全球最强超算Summit,95%算力来自NVIDIA Volta显卡
上周末美国能源部下属的橡树岭国家实验室宣布全球最强超算Summit(峰会),其浮点性能可达20亿亿次,是现有TOP500冠军太湖之光的1.6倍多,可以预定新一届TOP500冠军了。美国这套超算是IBM、NVIDIA联合研发的,分别使用了IBM Power 9处理器及NVIDIA Tesla V100加速卡,而95%的算力其实都来自Tesla显卡。
Summmit超算跟美国上一次获得TOP500冠军的超算Titan一样都是CPU+GPU异构体系的,不同的是之前使用的是AMD Opteron 16核及NVIDIA Tesla K20X加速卡,这次使用的是IBM Power 9 22核处理器及NVIDIA Tesla V100加速卡。
异构超算的性能强大很大程度上取决于GPU的性能,在Summit超算中也不例外,其20亿亿次的性能绝大部分都来自GPU。在这套系统中,总计4608个节点,每个节点配备了2个IBM Power 9处理器及6个Tesla V100加速卡,而且使用的是性能最强的NVLink版Tesla V100加速卡,单精度性能15.7TFLIPS,双精度性能7.8TFLOPS,Tensor性能125TFLOPS。
根据NVIDIA所说,他们的27648个GPU能够带来300亿亿次的Tensor性能,从这点上也可以算出Summit使用的Tesla V100其实是降频了的,按照NVIDIA之前公布的数据来算其Tensor性能将达到3.456百亿亿次(17648*125TFLOPS)。
NVIDIA表示Summit的性能是Titan的100倍多,其中95%都来自NVIDIA的Tesla加速卡,不过这指的是Tensor性能,实际性能只是Titan的10倍多点,再者说跟CPU比Tensor性能也有点关公战秦琼的意味,后者本来也不是做这个的。
通常来说,CPU+GPU异构超算在跑程序上不如纯CPU架构那么高效,不过好处就是性能强,能效高,13MW的功耗只比Titan的8-9MW高出50%左右,但性能提升了10倍多,Tensor性能提升了100倍。