超能课堂(94):深入探索GPU BOOST 3.0
NVIDIA一年前发布了第一款Pascal架构游戏卡GTX 1080,性能上做到了越级挑战上一代的Titan,依靠的是什么?除了CUDA数量、频率飙升以外,还有神秘的GPU BOOST 3.0,当时我们曾经写过关于它的超能课堂——《NVIDIA显卡性能靠频率?GPU Boost是怎么回事?》,不过也就是浅尝辄止,从原理上探讨了它的实行,这次我们实打实战来探索它。
我们回顾一下NVIDIA三代GPU BOOST技术的关键要点:
GPU BOOST 1.0
最早出现在GTX 600系列的Kepler架构显卡中,其中关键要素在于功耗上。只要功耗未达到规定上限,频率就可以一直往上飙,直到达到功耗上限阈值时,就会降低频率,保证功耗不超过阈值范围。也因此boost频率很小,最多不超过100MHz。但是玩家们很精明,很快发现这个功耗上限阈值是写在BIOS里面,只要修改功耗上限值大小,boost幅度也随之提高。从此功耗墙的概念在发烧玩家中不胫而走。
GPU BOOST 2.0
在Kepler架构GTX 700系列以及Maxwell GTX 900系列显卡中使用了新的GPU BOOST 2.0,在原来的“功耗墙”上多加了一堵“温度”墙。同时利用温度来控制boost频率浮动,主要是弥补GPU BOOST 1.0中,GPU核心在为未达到功耗上限时,boost频率不断提升,此时核心温度很可能已经承受不了,GPU BOOST 2.0可以保证GPU核心温度工作在正常范围内,防止温度失控而风扇转速也达到上限,你总不想一边玩着游戏,一边听着显卡风扇快速起飞的噪音吧?
GPU BOOST 3.0
在去年的Pascal架构GTX 1000系列显卡中使用了更先进的GPU BOOST 3.0,如果说前两代GPU BOOST技术boost频率幅度不大,那么GPU BOOST 3.0就是飞跃式的进步,boost频率幅度达到300-400MHz更是稀疏平常的事情。这是为什么?那就是频率与电压之间的关系不再是线性,它们是一对一的关系,一个电压值对应一个频率,而且我们可以手动调节。同时,GPU BOOST 3.0集成了前两代GPU BOOST技术的精华。
我们再来看一看NVIDIA给出的GPU BOOST 3.0示意图,白色实线代表了NVIDIA在BIOS中写死的隐形上限,目前除非硬改PCB电路以外,没有什么办法可以突破它,毕竟这个上限是NVIDIA在硬件上监测到数据结合程序约束住这个上限。
白色虚线是显卡出厂时BIOS中默认提供的基准频率,而绿色虚线则是玩家在使用中实际获得的最高频率。看,在解除频率与电压之间线性关系后,一对一可调整之后,绿色虚线更加贴近了NVIDIA所设置的隐形上限,从而达到更加高的boost频率,因此Pascal显卡之所以有这么高的运行频率,这个和GPU BOOST 3.0应用不无关系。
所以说,为什么同一核心的显卡,即便是你默认频率高,但是成绩却不如频率稍低的显卡,这都是GPU BOOST 3.0干得好事。因为其中涉及到的功耗、温度与显卡厂商们的设计有非常大关系。
先说说功耗上问题,现在的“高端”显卡都有种堆料的习惯,16相供电对于大家来说已经司空见惯的事情,那么他们有作用吗?在这里我们需要肯定一下多相供电实际作用,相数越多,供电当然越稳定,每项通过的电流减少,发热自然而然也会减少,也有利于超频稳定性。但是至于16相供电是否有必要,这个问题真的不好弄懂,NVIDIA的公版卡供电相数比较少,就连GTX 1080 Ti Founder Edition也只需要7相核心供电,但也使用了双MosFET提供稳定供电,就说NVIDIA在有需求情况下也会额外增加供电相数。
所以说,如果消费者所花费的金钱总是一定,PCB用料越多,你是不是应该更加高兴,更愿意选择它?
另一方面,显卡厂商会根据这张显卡的市场定位、需求,为其设置不同的TDP功耗上限值,也就是我们所说的功耗墙。现在我们已经不需要用的NVIDIA的SMI工具,也能直接使用GPU-Z 2.1.0版本直接查看到。这个值很大程度上制约了你boost频率高度,TDP值越高对于冲击更高boost频率更有利。
再说说温度的问题,以非公版GTX 1080 Ti为例,我们看到了大部分厂商为了压制住GP102这只“洪荒”巨兽的发热量,三风扇五热管已经成为了标准配置,当然还有更加夸张的,这里按下不表。这都是为了什么?“王者荣耀”?不不不,是为了更低的核心温度。保持相对的低温更加有利于显卡GPU boost频率发挥,这个在我们显卡煎鸡蛋里面有了非常好的反面例子,超过了温度上限,不死机,但是会降频运行。
所以才有了那么多显卡厂商在高端型号显卡上,煞费苦心地专研散热器设计、风扇设计,都是为了保证GPU核心长时间工作在高频状态,不掉频,就是不掉性能。
另外还有一个大家都认为非常“玄学”的问题,那就是GPU核心的体质问题。不可否认,核心的体质直接影响到boost频率的上限,这就是为什么有些显卡非常容易超频,可以达到2.1GHz水平,而另一部分显卡只有2.0GHz水平,这就是个体质引起的,也是广大玩家口中的“大雷”、“大雕”的来源。
讲了那么多,测试呢?都在这里,我们一步一步来验证。
温度&频率关于时间的关系:
从图表中我们看到,随着时间的推移,在运行3DMark Fire Strike压力测试中,GP102的巨大热量慢慢体现出来,不断堆积,最终温度达到了76℃,这个过程中我们明显看到GPU核心频率从原来最高的1923.5MHz缓缓下降至1873MHz水平,降频幅度有50MHz之多。这个可以看作是GPU BOOST 3.0下的温度控制测试,显卡核心过热就会自动降频。
频率与温度之间的关系:
如果我们测试更为极端一点,模拟显卡风扇失效的情况的话,频率与温度之间的关系会更加明显。将GTX 1080 Ti的风扇转速固定在25%上,运行3DMark Fire Strike压力测试,并且记录下温度。
从图表中我们看到,一开始GTX 1080 Ti的运行频率还是很不错的,即便是在60℃也能跑在1900MHz以上,不过随着GP102核心积热,无法及时散热,温度情况快速劣化,GPU核心频率一降再降,在92℃时,GPU核心频率已经只有1700MHz水平,性能也大打折扣。
当然了,我们曾经做过更加极端的测试——将显卡风扇完全停转,继续跑游戏,虽然没有发生黑屏、死机问题,但是频率降到700MHz水平。画面非常卡顿,不过这也是显卡自我保护的一种方式,可以避免显卡在这种情况下烧毁的惨剧。
电压与频率的关系:
我们可以从如MSI Afterburner超频软件中读取从这块显卡的电压与频率对应关系曲线。这里我们还是以同一张GTX 1080 Ti作为例子,为大家展示两者的关系。
从图表中观察到,电压与频率之间是非线性关系的,但是有一个一一对应的过程,一个电压对应一个频率,但是从1062mV开始,即便是电压再有提升,GPU核心频率还是维持原貌,这很大程度是为了保护GPU核心安全,过高的电压很容易击穿晶体管,一旦击穿了并非说完全开不了机,而是性能很可能再也无法达到原来的高度。
另外如果我们使用MSI Afterburner超频软件进行超频操作,Core Clock+XXXMHz这样,那么这个电压-频率曲线就会上移。也就是同一个电压点,频率+XXXMHz。有经验的玩家很快就发现,这样的超频根本不能压榨出显卡核心的全部性能,需要对电压-频率点进行一一单独操作,确保不那么容易碰到显卡的功耗墙情况下,尽可能贴近NVIDIA设计的“隐形墙”。
这里给大家推荐超频使用EVGA家的PrecisionX OC超频软件,虽然安装后需要注册才能使用,但是对于显卡电压-频率点单独操作非常方便,界面直观明了。
频率&电压关于时间的关系:
运行3DMark Fire Strike压力测试,从图中可以得知,频率与核心电压的变化状态是一致的,印证了两者是一种一一对应的关系。
那么关于GPU BOOST 3.0的讲解到这里就基本结束了,如果你对此有所疑问或者是有不同见解,可以踊跃地发布你的意见,抑或向小超哥微信9501417促膝长谈。