GTX 1080显卡计算性能测试:专业的归专业,游戏的归游戏

记得当初GTX Titan显卡刚发布时,NVIDIA官方强调它不仅仅是最强游戏显卡,而且还可以做专业卡,不仅是因为它强大的性能,也与当初GK110核心保留了专业级的双精度性能有关。GTX Titan X发布时,NVIDIA为它配备了12GB显存,当时也有说是给一些专业用户预留的,这一次Pascal架构显卡也发布了,其计算性能又如何呢?

对于NVIDIA Kepler及Maxwell架构的计算性能,我们之前分别做过单独的分析和测试,详情可以参考:

GP104架构计算性能改进

与专门针对HPC市场的GP100大核心相比,GP104是针对游戏市场的,后者对GPU通用计算性能并没有多高的精度要求,特别是FP64双精度性能更没特别要求,而高精度浮点运算需要太多的计算单元,因此这种出力不讨好的设计在游戏GPU上并不受欢迎,GP104相比GP100就砍掉了很多与计算无关的设计——包括NV Link、1:2的FP64性能等,HBM 2显存也降级到了GDDR5X。

在此前的GTX 1080架构分析中,我们可以看到GP104核心的SM单元架构与前代GM204架构非常相似,每组SM单元也是128个CUDA核心(FP32),其中有4组FP64双精度单元,FP64:FP32的比例还是1:32,这一点与GTX 980/GTX 980 Ti都是相同的,与GP100核心FP32:FP64的1:2超高比例大不相同。

对AMD、NVIDIA来说,GPU的单双精度比都是根据需要来设计的,“同一个”核心可能有不同的变化,比如AMD的FirePro W9100跟R9 290X一样都是2816个流处理器单元,但前者的单双精度比是1:2,后者就只有1:4,而Fury X的Fiji核心虽然浮点性能高达8.6TFLOPS,但单双精度比下降到了1:16,Radeon Pro Duo显卡同核心的FirePro S9300 X2发布时AMD也只强调它是单精度最快的加速卡,因为双精度性能不过0.8TFLOPS,比FirePro S9170/9100还要低得多。

对GP104核心来说,尽管单双精度比维持了GM204/GM200核心的1:32,不过它也不是没有改进,它支持了FP16半精度运算,而且FP32:FP16比例是1:2,也就是说半精度性能是单精度的2倍,上个月的GTC大会上,NVIDIA推出的DGX-1深度学习超算就是强调半精度性能的。

GM204核心的Maxwell架构中,FP16半精度性能与FP32单精度性能还是1:1的,也就是没做优化支持。不过早在Tegra X1芯片发布时,NVIDIA就开始强调混合精度,也就是支持FP16半精度运算的,理论上目前的Maxwell架构也是可以做优化的。

不过实际测试中Maxwell的FP16半精度运算是不理想的,Sandra 2016的GPU计算中,GTX 980/980 Ti显卡的FP16显示是“模拟”出来的,而GTX 1080是“原生”,而且GTX 1080的FP16原生性能远远低于GTX 980显卡“模拟”出来的性能,这很可能意味着GTX 1080显卡现在的FP16支持还没做好驱动支持。

下面就是GTX 1080显卡的计算性能实测,对比的只有GTX 980和GTX 980 Ti,因为手头没有Fury X显卡了。

GTX 1080显卡与GTX 980显卡的计算性能对比

在计算性能方面,GTX 1080的浮点性能是9TFLOPS,GTX 980是5TFLOPS,实测结果也是大比分领先了GTX 980显卡,Sandra的双精度、四精度领先优势更明显。

GTX 1080显卡与GTX 980 Ti显卡的计算性能对比

与GTX 980 Ti显卡相比,GTX 1080的运算性能领先幅度就没这么明显了,当然比GTX 980 Ti领先还是很是有的,特别是Sandra、AIDA64的GPU计算中。

手头没有Fury X显卡了,所以没法对比它的计算性能,不过Fury X的浮点性能也有8.6TFLOPS,与GTX 1080差不多,单双精度比是1:16,要高于GP104核心,理论上其计算性能不会比GTX 1080差多少,双精度应该更有优势。

总之,GP104核心因为是专注游戏市场的,所以在计算性能方面,GTX 1080相比GTX 980并没有明显的架构改变,但它依然有两大优势——首先是GPU性能强劲,浮点性能依然大比分优势领先GTX 980显卡,比GTX 980 Ti也有1/4的提升。

第二点,Pascal架构原生支持FP16半精度运算,高精度运算对游戏、VR来说可能没什么意义,但原生支持FP16半精度运算可以大幅提升计算性能,NVIDIA目前主要强调应用在深度学习中,但未来游戏及VR都有可能因此受益。

(0)

相关推荐