NVIDIA发布AI计算卡Tesla P40:完整版GP102大核心,24GB显存

在昨天的北京GTC大会上,NVIDIA发布了三款重量级新产品,包括面向AI人工智能的两款显卡——Tesla P40、Tesla P4,还有单芯片系统的Drive PX2自动驾驶平台。在这其中,Tesla P40使用的是P102大核心,而且是完整版的3840核心,搭配24GB显存,这也是继Tesla P100(分为NV Link和PCI-E两种版本)、Quadro P6000、Titan X显卡之后第四款GP100/102核心产品了。

NVIDIA发布面向AI计算的Tesla P40和P4显卡

NVIDIA的Pascal家族显卡中旗舰版产品多使用GP100大核心,中高端则使用GP104核心,其中GP100大核心才真正是全新架构,计算性能提升很大,而GP10X核心更多地像是Maxwell架构的16nm工艺版,架构变化并不大,SM单元设计甚至是一样的。

这次发布的两款新卡主要面向AI计算,包括语音激活的应用、电影及产品搜索推荐等,与单纯的CPU加速相比,NVIDIA宣称他们的GPU加速方案性能、效能是前者的45倍之多。

这次发布的Tesla P40、Tesla P40显卡分别使用了GP102、GP104核心,主要取代Maxwell架构的Tesla M40、M4加速卡,具体规格如下:

NVIDIA Tesla P40/P4显卡主要规格(来源于Anandtech网站)

Tesla P40基于完整版GP100核心,这也是Quadro M6000之后第二款完整版GP100大核心产品,3840个CUDA核心,基础频率1303MHz,加速频率1531MHz,这主要是考虑到被动散热,NVIDIA降低了GPU频率。

此外,P40显卡还有384bit GDDR5位宽,频率7.2Gbps,总容量24GB——其实这卡跟面向工作站的Tesla P6000很可能是一样的,规格基本相似,浮点性能都是12TFLOPS,TDP250W。

至于Tesla P4,它使用的是GP104核心,跟GTX 1080是一样的,拥有2560个CUDA核心,不过频率也低得多,基础810MHz,加速频率1063MHz(几乎只有GTX 1080一半频率了),配备256bit 8GB显存,但该卡最大的亮点是TDP只有50-75W,完全不需要辅助供电了。

值得注意的是,Tesla P40、P4显卡都支持INT8计算,浮点性能分别高达47TFLPS、22TFLOPS,这是Maxwell加速卡不具备的能力。

此外,NVIDIA这次还发布了单芯片的Drive PX2自动驾驶平台,今年CES上发布的Drive PX2使用的是双路Tegra“Parker”处理器+双路Pascal显卡,性能倒是很逆天,不过双路CPU+GPU也提高了成本,这次的单路Drive PX2直接使用了最新的Tegra SoC处理器,换句话说NVIDIA这次的新品是Drive PX2砍掉了独显和一组处理器之后的产物。

单芯片Drive PX2预计今年Q4季度出货,标准版Drive PX2今天起开始出货——话说Drive PX2都发布8个多月了,现在才出货啊!

关注微信号expkf01,第一时间获知精彩活动和原创科技资讯。

(0)

相关推荐