一文讲述Quadro RTX 5000带来的性能提升

2024-06-07 11:11:51

GPU在传统图形可视化领域的应用不断的扩大，无论是在3D设计，大分辨率多屏拼接显示，还是特效渲染领域，越来越多的人转向使用更加稳定的专业图形卡。深度学习和大数据作为新锐行业也大量地使用专业的GPU，以加速训练研发的速度。

最新基于Turing架构的NVIDIA Quadro GPU系列从去年就开始上市。本篇开箱评测分享将告诉你最新的Quadro RTX 5000有那些改变，又有哪些提升呢？

开箱

本次显卡包装改变了以往的颜色、风格，使用绿白灰搭配，正面的灰色格子采用渐变的颜色很有现代感和立体感。包装的正面和顶部、侧面都有显卡型号的标识。

RTX几个字有金属反光效果，凸显了这代显卡最重要的功能之一——实时光线追踪。

整体拿在手里沉甸甸的，挺有分量，包装的材质很结实。

显卡包装及配件

内部包装也和以往包装不一样，外壳和防震泡沫是一体的，显卡安置在其中，给人的感觉是坚固、牢靠。

显卡外面还有一层透明防静电袋，配线盒里面有用户手册、支持手册、 8pin转双6pin电源线、DP转DVI转接头和DP转HDMI转接头。这是众多使用DVI显示器或HDMI显示器的福音，再也不用另外单独购买转接头了。

显卡正面

显卡外观主要采用绿、银色和黑色搭配，与包装风格一致。显卡也是沉甸甸的，质感很不错。在显卡正面和脊背上都能看到显卡型号的标识。

Quadro RTX 5000依然是双插槽显卡，1个涡轮风扇，显卡采用8pin加6pin的供电方式，对于最大功耗为265W的RTX 5000来讲是足够用了。

显卡顶部接口

显卡顶部总共有3个接口，NVLink、SYNC、Stereo。

NVLink技术取代了SLI技术，可以配合Quadro NVLink 2-Slot或者3-Slot使用。NVLink技术不但具备多卡同步输出的功能，在应用支持的情况下，还能实现显存叠加的功能，使两块卡叠加成一个更大的显存。

SYNC接口要配合Quadro SYNCII卡来使用，实现多卡的显示信号同步输出。对于大屏拼接的用户来讲可以延续之前的使用方法。

Stereo接口要配合3D立体档板来输出3D立体信号。

总线接口是PCIE 3.0接口，向下兼容PCIE 2.0。目前市场上主板大都是使用这种接口的。

显卡显示接口

显示接口有了新的变化，不是4DP+DVI的配置，改成了4DP+VirtualLink的配置。

DP接口都支持DP 1.4的协议，最高分辨率可以达到7680x4320。而VirtualLink接口则是下一代VR设备使用的标准接口，一个接口可完成供电、显示传输、控制信号多个功能。

性能测试

显卡参数

测试平台

测试软件

测试内容展示

SPECviewperf 13

SPECviewperf 13是基于专业应用上衡量图形性能被广泛应用的测试软件。该软件对基于OpenGL和DirectX的专业绘图软件进行基准评测，SPECviewperf 13带来了全新的9个专业图形测试场景,SPECviewperf13测试更加贴近真实的工作应用, 其中一些测试场景甚至包含有超过6,000万个定点数据，能够充分反映出显卡的专业图形性能，此次测试我们使用软件默认配置进行评测。

测试结果

从测试结果来看，RTX 5000在所有项目上普遍超越了Quadro P5000，snx的性能甚至增加了40%以上。看来Turing架构增加的不仅仅是光线追踪和深度学习的效率，在专业应用的性能上增加的幅度也是很大的。

SuperPosition Benchmark

这款软件更像是在一个复杂的游戏环境，在不同的光场效果中对显卡DX和OpenGL渲染性能及稳定性的评测。

测试结果

在DirectX的性能方面，RTX 5000比P5000提高了近45%，在OpenGL方面，RTX 5000比P 5000提高了性能提高了50%左右。两个主要的图形API的性能都增加了很多，相信RTX 5000在专业3D可视化领域有了更高的可用性。

V-Ray Benchmark

Chaos Group的V-Ray在渲染领域早已被广大用户认可了，由于GPU渲染性能的提升，Chaos Group在V-Ray Next上推出了V-Ray GPU NEXT版本，支持调用NVIDIA CUDA核心进行渲染，随着技术的不断更新，GPU渲染的质量上几乎和CPU没有区别。GPU算力强劲渲染时间成本会更低，并且支持多卡加速渲染，所以很多渲染器都在增加自己的GPU渲染功能。本次评估仅测试单卡的渲染性能，时间越短性能越好。

测试截图

测试结果

从测试结果看，使用最新的RTX 5000比P5000节省了35%的时间。在V-Ray渲染中RTX 5000的效率会更高一些。

CUDA-Z

就像我们熟知的CPU-Z 、GPU-Z一样，CUDA-Z是对NVIDIA GPU处理器的一些基本信息的采集，GeForce、Quadro、Tesla卡都可以配合使用。

测试截图

CUDA计算能力

在CUDA-Z的测试项目中，我们实际用到最多的是单精度浮点运算，如果有使用到双精度科学计算的，推荐使用GV100或者GP100双精计算能力高的GPU。

RTX 5000单精计算的能力达到了11.7T，相对于前一台P5000提高了36%，提升幅度很大。这么强的单晶浮点数是CPU不能匹敌的，这也是越来越多的应用把计算从CPU转向了GPU的原因。

3DMark Port Royal

测试场景

测试结果

目前NVIDIA的RTX渲染的Benchmark功能，3DMark的Port Royal可以支持性能测试。Quadro P5000由于没有RT Core所以无法使用这个评测软件。

测试场景里带了大量金属的材质，反射效果惊艳。RTX 5000渲染FPS达到了28左右帧，还算流畅。目前游戏行业已经有BF5使用这种技术，相信未来在工业制造领域和影视后期领域都会被广泛的使用。

OctaneBench 2019 Preview

OC渲染器是做3D设计及动画的一款支持GPU渲染的渲染器，可以配合很多3ds Max、CINEMA 4D、NUKE、MODO等3D建模及特效的软件。OC渲染器是可以支持Out of Core的渲染软件，最新的OctaneBench 2019 Preview是可以支持RT Core加速光线追踪渲染的软件。我们可以看一下使用和关闭RTX在渲染速度上的区别。

测试截图

软件分别在开启RTX和关闭RTX状态下对相同场景进行渲染，从测试成绩上可以看出，开启了RTX On渲染之后，渲染的速度比关闭RTX渲染速度快了近3倍。可见在RT Core的加成下，渲染速度有了很大的提升。

NVIDIA Tensorflow example

我们选择NVIDIA Tensorflow的一个示例来测试显卡的性能。在相同参数设置的情况下，显卡在一秒内训练的图片数越多，说明显卡在实例深度学习方面的性能越好。

上图可以看到，RTX 5000在满载时候每秒处理的数量最多为441张。

P5000在上图此示例中每秒处理的图片数最多为194张。

从每秒处理数据的性能上看，RTX 5000处理速度是P5000的2.2倍。速度快了很多，这是由于调用了Tensor Core进行计算的原因。可见Tensor Core在深度学习的加速上还是有很大作用的。Quadro RTX高端显卡都具有Tensor Core，基于这种显卡可以实现图像加AI的一些应用。例如在渲染的同时可以实现去AI噪点，图像AI识别，或者其他AI推理的一些工作。

总结

RTX 5000显卡最大的特点是：

具有RT Core支持RTX实时光线追踪渲染，能渲染出具有流光溢彩真实感的画面。渲染速度非常快，在诸多行业可视化的工业设计流程上会有很好的推动作用。

具有Tensor Core，可以加速深度学习和AI推理。在人工智能大力发展的今天，有了Tensor Core的加持，很多应用会变得如虎添翼。

传统的图形应用性能优化和稳定性都继承了下来，并且性能表现的更好。使用Fermi 、Kepler、Maxwell架构的用户可以考虑RTX系列显卡进行更新换代了。

七彩虹iGame 非公版RTX 3070 显卡首发评测

英伟达的RTX 3070显卡现在已经解禁了性能评测,它能以RTX 3080 70%的功耗发挥出它80%的性能,能耗比提升了不少,并且售价只要3899元起,对于预算不足以买RTX 3080的玩家来说,R ...
索泰RTX 3070 X-GAMING OC显卡评测

索泰的X-GAMING系列显卡定位高性价比,针对游戏玩家拥有着超越公版的性能以及个性十足的外观.我们超能网之前曾经测试过索泰的RTX 3090 X-GAMING OC显卡,表现是非常不错的.这次RTX ...
NVIDIA NVENC编码加速器测试：4K视频生产力大提升

显卡最早只不过是PC中的一个负责显示输出的零部件,最初显卡的作用就是把图形处理能力从CPU里独立出来.然而随着通用计算理念的诞生,GPU可以做越来越多的运算,俨然已经成为PC中的最核心部件.越来越多的 ...
ROG冰刃4 Plus轻薄游戏本评测：液金加持下的新性能传奇

在顶级游戏本阵容中有一道身披红色战甲的身影是不得不提的,那就是来自于ROG的冰刃系列.冰刃系列从一开始就采用了轻薄化的设计风格,在以傻大黑粗为主流风格的游戏本中杀出了一条属于自己的路.随着今年四月份I ...
想体验8倍速的创作快感？你需要一张RTX显卡

今年的一场新冠肺炎可能让我们更快速或者说提前了解了未来的生活方式--各种数字化产品将会越来越多的填满我们的生活.当然这些数字化产品也是需要人来创作的,并且对于这种产品类别,出现了越来越多的以个人为单位 ...
RT Core对于渲染的加速作用如何？来看这组针对Blender 2.81的测试

前些天Blender正式更新了2.81版本,加入了OptiX渲染后端,使得其支持使用Turing GPU上面的RT Core对光追进行硬件加速,那么它的表现到底如何呢?Phoronix搞了个测试,他们 ...
卓越生产力工具！NVIDIA RTX A6000专业显卡测试

[前言] NVIDIA在1999年8月发布首款真正意义上的可编程GPU--GeForce 256,从此奠定了显卡在PC中的重要地位.同年11月再度推出基于GeForce 256核心.定位生产力工具的Q ...
RTX 30笔记本首发评测：机械师F117-X 轻薄游戏本

要说2021年1月有什么数码大事件 ,RTX 30系列笔记本的发布绝对算一个. 近日,机械师MACHENIKE正式发售了一款RTX 3070笔记本电脑:[战空]F117-X.其轻薄的机身造型以及高达1 ...
NVIDIA正式公布Turing架构：自2006年以来图形界最伟大的跨越

虽然NVIDIA正式公布新一代的GeForce游戏卡应该要等到下周科隆游戏展前的"GeForce Gaming Celebration"活动,但是在昨天正式开幕的SIGGRAPH ...
华硕TUF RTX 3090 GAMING显卡评测

华硕TUF RTX 3080 GAMING在坊间被众多网友称为最香的RTX 3080显卡,采用了20相供电配上强劲散热,可以说其虽然是属于华硕家族亲民的TUF系列,但是同样具有高端豪华的用料以及性能表 ...
NVIDIA图灵显卡光线追踪性能5倍提升，前AMD GPU业务老大点赞

NVIDIA昨天发布的图灵架构显卡Quadro RTX 8000/6000/5000系列主要面向光线追踪渲染,为此NVIDIA都改了之前的品牌,而游戏卡应该也会从GeForce GTX改成GeForc ...
七彩虹将星X15 AT笔记本评测：新国风游戏本进阶之选

随着从硬件厂商向系统集成转型,七彩虹在今年3月份推出了国风游戏本--将星X15,加入了国风元素,重塑雷震子传统神话人物形象作为产品的虚拟代言人,是国内首款IP定制化国风游戏本,以"国风&qu ...
GeForce RTX 3080显卡天梯榜评测：史诗级飞跃

从目前的游戏生态来看,具有实时光线追踪画面已然是3A大作的开发方向,这是将游戏画面真实度带上新台阶的一项重要技术,而它的起点就是率先支持实时光线追踪的英伟达图灵架构显卡.除此之外,实现更好的游戏画面还 ...
2021 年最佳 3D 渲染 GPU

高质量的视觉图形对于媒体.电影.平面设计.动画.空间研究.建筑.室内设计等行业至关重要.所有这些行业都依赖于渲染过程来获得各种专业项目的所有结果.过去几年,GPU渲染技术如风暴般席卷IT行业.虽然 G ...
雷神911 Pro游戏本体验：实时光追 DLSS 2.0

目前在笔记本电脑市场中,游戏本已经成为了很多玩家的关注热点,因为现在的游戏本在体验上已经不逊色于同价位的桌面PC.而作为一款游戏本,GPU可以说最重要的组成部分,因为其直接影响着笔记本的游戏体验.笔记 ...
微星RTX 3060 GAMING X显卡评测：新一代甜点显卡阵容中的精品之作

微星上一代的魔龙系列显卡凭借精致的做工与外观设计给很多人都留下了深刻的印象,随着新一代的GPU发布,微星现在推出了新的超龙系列,而老将魔龙系列也将继续服役,并且变得更有性价比. 这一代的魔龙同样也覆盖 ...
Quadro RTX A6000将配备完整版的GA102核心

NVIDIA的GeForce RTX 3090与RTX 3080用的都是安培架构的GA102核心,但即使是RTX 3090也没用上完整版的核心,只开启了10496个CUDA,关闭了两组SM,而完整版的 ...

一文讲述Quadro RTX 5000带来的性能提升

相关推荐