超能课堂(94)：深入探索GPU BOOST 3.0 / 开普饭

NVIDIA一年前发布了第一款Pascal架构游戏卡GTX 1080，性能上做到了越级挑战上一代的Titan，依靠的是什么？除了CUDA数量、频率飙升以外，还有神秘的GPU BOOST 3.0，当时我们曾经写过关于它的超能课堂——《NVIDIA显卡性能靠频率？GPU Boost是怎么回事？》，不过也就是浅尝辄止，从原理上探讨了它的实行，这次我们实打实战来探索它。

我们回顾一下NVIDIA三代GPU BOOST技术的关键要点：

GPU BOOST 1.0

最早出现在GTX 600系列的Kepler架构显卡中，其中关键要素在于功耗上。只要功耗未达到规定上限，频率就可以一直往上飙，直到达到功耗上限阈值时，就会降低频率，保证功耗不超过阈值范围。也因此boost频率很小，最多不超过100MHz。但是玩家们很精明，很快发现这个功耗上限阈值是写在BIOS里面，只要修改功耗上限值大小，boost幅度也随之提高。从此功耗墙的概念在发烧玩家中不胫而走。

GPU BOOST 2.0

在Kepler架构GTX 700系列以及Maxwell GTX 900系列显卡中使用了新的GPU BOOST 2.0，在原来的“功耗墙”上多加了一堵“温度”墙。同时利用温度来控制boost频率浮动，主要是弥补GPU BOOST 1.0中，GPU核心在为未达到功耗上限时，boost频率不断提升，此时核心温度很可能已经承受不了，GPU BOOST 2.0可以保证GPU核心温度工作在正常范围内，防止温度失控而风扇转速也达到上限，你总不想一边玩着游戏，一边听着显卡风扇快速起飞的噪音吧？

GPU BOOST 3.0

在去年的Pascal架构GTX 1000系列显卡中使用了更先进的GPU BOOST 3.0，如果说前两代GPU BOOST技术boost频率幅度不大，那么GPU BOOST 3.0就是飞跃式的进步，boost频率幅度达到300-400MHz更是稀疏平常的事情。这是为什么？那就是频率与电压之间的关系不再是线性，它们是一对一的关系，一个电压值对应一个频率，而且我们可以手动调节。同时，GPU BOOST 3.0集成了前两代GPU BOOST技术的精华。

我们再来看一看NVIDIA给出的GPU BOOST 3.0示意图，白色实线代表了NVIDIA在BIOS中写死的隐形上限，目前除非硬改PCB电路以外，没有什么办法可以突破它，毕竟这个上限是NVIDIA在硬件上监测到数据结合程序约束住这个上限。

白色虚线是显卡出厂时BIOS中默认提供的基准频率，而绿色虚线则是玩家在使用中实际获得的最高频率。看，在解除频率与电压之间线性关系后，一对一可调整之后，绿色虚线更加贴近了NVIDIA所设置的隐形上限，从而达到更加高的boost频率，因此Pascal显卡之所以有这么高的运行频率，这个和GPU BOOST 3.0应用不无关系。

所以说，为什么同一核心的显卡，即便是你默认频率高，但是成绩却不如频率稍低的显卡，这都是GPU BOOST 3.0干得好事。因为其中涉及到的功耗、温度与显卡厂商们的设计有非常大关系。

先说说功耗上问题，现在的“高端”显卡都有种堆料的习惯，16相供电对于大家来说已经司空见惯的事情，那么他们有作用吗？在这里我们需要肯定一下多相供电实际作用，相数越多，供电当然越稳定，每项通过的电流减少，发热自然而然也会减少，也有利于超频稳定性。但是至于16相供电是否有必要，这个问题真的不好弄懂，NVIDIA的公版卡供电相数比较少，就连GTX 1080 Ti Founder Edition也只需要7相核心供电，但也使用了双MosFET提供稳定供电，就说NVIDIA在有需求情况下也会额外增加供电相数。

所以说，如果消费者所花费的金钱总是一定，PCB用料越多，你是不是应该更加高兴，更愿意选择它？

另一方面，显卡厂商会根据这张显卡的市场定位、需求，为其设置不同的TDP功耗上限值，也就是我们所说的功耗墙。现在我们已经不需要用的NVIDIA的SMI工具，也能直接使用GPU-Z 2.1.0版本直接查看到。这个值很大程度上制约了你boost频率高度，TDP值越高对于冲击更高boost频率更有利。

再说说温度的问题，以非公版GTX 1080 Ti为例，我们看到了大部分厂商为了压制住GP102这只“洪荒”巨兽的发热量，三风扇五热管已经成为了标准配置，当然还有更加夸张的，这里按下不表。这都是为了什么？“王者荣耀”？不不不，是为了更低的核心温度。保持相对的低温更加有利于显卡GPU boost频率发挥，这个在我们显卡煎鸡蛋里面有了非常好的反面例子，超过了温度上限，不死机，但是会降频运行。

所以才有了那么多显卡厂商在高端型号显卡上，煞费苦心地专研散热器设计、风扇设计，都是为了保证GPU核心长时间工作在高频状态，不掉频，就是不掉性能。

另外还有一个大家都认为非常“玄学”的问题，那就是GPU核心的体质问题。不可否认，核心的体质直接影响到boost频率的上限，这就是为什么有些显卡非常容易超频，可以达到2.1GHz水平，而另一部分显卡只有2.0GHz水平，这就是个体质引起的，也是广大玩家口中的“大雷”、“大雕”的来源。

讲了那么多，测试呢？都在这里，我们一步一步来验证。

温度&频率关于时间的关系：

从图表中我们看到，随着时间的推移，在运行3DMark Fire Strike压力测试中，GP102的巨大热量慢慢体现出来，不断堆积，最终温度达到了76℃，这个过程中我们明显看到GPU核心频率从原来最高的1923.5MHz缓缓下降至1873MHz水平，降频幅度有50MHz之多。这个可以看作是GPU BOOST 3.0下的温度控制测试，显卡核心过热就会自动降频。

频率与温度之间的关系：

如果我们测试更为极端一点，模拟显卡风扇失效的情况的话，频率与温度之间的关系会更加明显。将GTX 1080 Ti的风扇转速固定在25%上，运行3DMark Fire Strike压力测试，并且记录下温度。

从图表中我们看到，一开始GTX 1080 Ti的运行频率还是很不错的，即便是在60℃也能跑在1900MHz以上，不过随着GP102核心积热，无法及时散热，温度情况快速劣化，GPU核心频率一降再降，在92℃时，GPU核心频率已经只有1700MHz水平，性能也大打折扣。

当然了，我们曾经做过更加极端的测试——将显卡风扇完全停转，继续跑游戏，虽然没有发生黑屏、死机问题，但是频率降到700MHz水平。画面非常卡顿，不过这也是显卡自我保护的一种方式，可以避免显卡在这种情况下烧毁的惨剧。

电压与频率的关系：

我们可以从如MSI Afterburner超频软件中读取从这块显卡的电压与频率对应关系曲线。这里我们还是以同一张GTX 1080 Ti作为例子，为大家展示两者的关系。

从图表中观察到，电压与频率之间是非线性关系的，但是有一个一一对应的过程，一个电压对应一个频率，但是从1062mV开始，即便是电压再有提升，GPU核心频率还是维持原貌，这很大程度是为了保护GPU核心安全，过高的电压很容易击穿晶体管，一旦击穿了并非说完全开不了机，而是性能很可能再也无法达到原来的高度。

另外如果我们使用MSI Afterburner超频软件进行超频操作，Core Clock+XXXMHz这样，那么这个电压-频率曲线就会上移。也就是同一个电压点，频率+XXXMHz。有经验的玩家很快就发现，这样的超频根本不能压榨出显卡核心的全部性能，需要对电压-频率点进行一一单独操作，确保不那么容易碰到显卡的功耗墙情况下，尽可能贴近NVIDIA设计的“隐形墙”。

这里给大家推荐超频使用EVGA家的PrecisionX OC超频软件，虽然安装后需要注册才能使用，但是对于显卡电压-频率点单独操作非常方便，界面直观明了。

频率&电压关于时间的关系：

运行3DMark Fire Strike压力测试，从图中可以得知，频率与核心电压的变化状态是一致的，印证了两者是一种一一对应的关系。

那么关于GPU BOOST 3.0的讲解到这里就基本结束了，如果你对此有所疑问或者是有不同见解，可以踊跃地发布你的意见，抑或向小超哥微信9501417促膝长谈。

超能课堂(94)：深入探索GPU BOOST 3.0

相关推荐