NVIDIA发布PCI-E版Tesla V100加速卡:功耗低了50W,性能降了
5月份的GTC 2017大会上,NVIDIA正式推出了新一代Volta架构显卡,跟去年的Pascal显卡一样,这次首发的自然是针对高性能计算市场的Tesla V100,还是NVLink 2总线版。当时更常规的PCI-E版Tesla V100显卡也曝光了,只是今天NVIDIA才算是正式发布PCI-E版Tesla V100加速卡,还是GV100大核心,5120个CUDA核心,16GB HBM 2显存,不过这版显卡的频率有所下降,以致于FP32浮点性能从15TFLOPS降至14TFLOPS,不过好处是TDP功耗从300W降至250W。
NVIDIA发布PCI-E版Tesla V100加速卡
去年发布Tesla P100时,NVIDIA首发的也是NVLink版,同样在6月份的SC超算会议上发布了PCI-E版Tesla P100显卡,今年的情况是一样的。与下图的P100相比,Tesla P100显卡的外观设计有所不同,从标志性的绿色+黑色变成了金黄色+黑色,大家觉得哪种配色更好看一些呢?感兴趣的可以加小超哥(id:9501417)微信聊聊。
Tesla P100的PCI-E版
PCI-E版显卡性能会略低于NVLink版,P100上如此,现在的V100也是如此,官方给出的规格对比如下图所示:
NVLink 2版与PCI-E版Tesla V100显卡性能对比
两种显卡主要是总线技术不同,NVLink 2版总线带宽300GB/s,PCI-E版是32GB/s,不过前者主要用于HPC,PCI-E用途更常规一些,总线带宽影响不是那么大。性能下降幅度主要是跟TDP功耗下降到250W有关,FP32性能从15TFLOPS下降到了14TFLPS,FP32性能从7.5TFLOPS下降到了7TFLOPS,深度学习性能从120TFLOPS降低到了112TFLOPS,下降幅度约为6%。
NVLink版Tesla V100加速频率1455MHz,照此计算的话,PCI-E版Tesla V100加速频率约为1370MHz,不过保留了完整的16GB HBM 2显存和900GB/s带宽,去年的PCI-E版Tesla P100中则有16GB、12GB两个版本,后者砍的更严重些。
NVIDIA别是PCI-E版Tesla V100显卡将在今年底出货,合作伙伴有HP企业等,不过官方没公布价格,实际上从去年的Tesla P100就一直没有公开价格,但传闻称售价在10000美元以上,这次的Tesla V100核心更大,显存频率更高,价格只会更贵——8路Tesla V100的DGX-1超算价格从去年的12.9万美元加价到了14.9万美元,大概可以估算下新卡会贵多少了。