NVIDIA发布AI计算卡Tesla P40：完整版GP102大核心，24GB显存 / 开普饭

在昨天的北京GTC大会上，NVIDIA发布了三款重量级新产品，包括面向AI人工智能的两款显卡——Tesla P40、Tesla P4，还有单芯片系统的Drive PX2自动驾驶平台。在这其中，Tesla P40使用的是P102大核心，而且是完整版的3840核心，搭配24GB显存，这也是继Tesla P100（分为NV Link和PCI-E两种版本）、Quadro P6000、Titan X显卡之后第四款GP100/102核心产品了。

NVIDIA发布面向AI计算的Tesla P40和P4显卡

NVIDIA的Pascal家族显卡中旗舰版产品多使用GP100大核心，中高端则使用GP104核心，其中GP100大核心才真正是全新架构，计算性能提升很大，而GP10X核心更多地像是Maxwell架构的16nm工艺版，架构变化并不大，SM单元设计甚至是一样的。

这次发布的两款新卡主要面向AI计算，包括语音激活的应用、电影及产品搜索推荐等，与单纯的CPU加速相比，NVIDIA宣称他们的GPU加速方案性能、效能是前者的45倍之多。

这次发布的Tesla P40、Tesla P40显卡分别使用了GP102、GP104核心，主要取代Maxwell架构的Tesla M40、M4加速卡，具体规格如下:

NVIDIA Tesla P40/P4显卡主要规格（来源于Anandtech网站）

Tesla P40基于完整版GP100核心，这也是Quadro M6000之后第二款完整版GP100大核心产品，3840个CUDA核心，基础频率1303MHz，加速频率1531MHz，这主要是考虑到被动散热，NVIDIA降低了GPU频率。

此外，P40显卡还有384bit GDDR5位宽，频率7.2Gbps，总容量24GB——其实这卡跟面向工作站的Tesla P6000很可能是一样的，规格基本相似，浮点性能都是12TFLOPS，TDP250W。

至于Tesla P4，它使用的是GP104核心，跟GTX 1080是一样的，拥有2560个CUDA核心，不过频率也低得多，基础810MHz，加速频率1063MHz（几乎只有GTX 1080一半频率了），配备256bit 8GB显存，但该卡最大的亮点是TDP只有50-75W，完全不需要辅助供电了。

值得注意的是，Tesla P40、P4显卡都支持INT8计算，浮点性能分别高达47TFLPS、22TFLOPS，这是Maxwell加速卡不具备的能力。

此外，NVIDIA这次还发布了单芯片的Drive PX2自动驾驶平台，今年CES上发布的Drive PX2使用的是双路Tegra“Parker”处理器+双路Pascal显卡，性能倒是很逆天，不过双路CPU+GPU也提高了成本，这次的单路Drive PX2直接使用了最新的Tegra SoC处理器，换句话说NVIDIA这次的新品是Drive PX2砍掉了独显和一组处理器之后的产物。

单芯片Drive PX2预计今年Q4季度出货，标准版Drive PX2今天起开始出货——话说Drive PX2都发布8个多月了，现在才出货啊！

关注微信号expkf01，第一时间获知精彩活动和原创科技资讯。

NVIDIA发布AI计算卡Tesla P40：完整版GP102大核心，24GB显存

相关推荐