解析苹果M1:ARM PC的未来影响有多大?

1

长短板都突出,封闭硬软件环境使其难以越界

关于苹果M1芯片的性能,我们在上期报纸已经推出了详细的评测内容,有兴趣的读者朋友可以自行查阅,简而言之,这是一款针对“苹果认为很重要的应用”,比如Final Cut Pro的8K分辨率HDR/H.265编码视频剪辑、AI音频提取、神经网络机器学习……

使用专用芯片进行特别优化的ARM架构SoC,在封装内集成了CPU、GPU和LPDDR4X内存颗粒,以我们对Mac mini的测试来看,在平台功耗控制在30W左右的前提下,特化后的测试项目性能远远超过了100W功耗以上的x86架构通用计算CPU,但未特化,尤其是未针对ARM原生编译的APP运行效率很低,两极趋势鲜明,而萦绕“M1是否能颠覆PC产业”的讨论热度也相当高.

那么,苹果自研Mac芯片究竟能有多大的影响力呢?

实测表明,M1芯片可以在Log+LUT的情况下流畅回放并编辑4K 120p 10bit 4:2:2 H.265视频

首先要注意一点,苹果M1并不是ARM阵营向x86 PC开的“第一枪”,高通骁龙850就曾经做出过尝试,代表机型就是当年的华为MateBook E,证明了ARM模拟运行Windows的可能性,并为为不少软件适配铺垫了道路,比如VS Code的社区支持。

但显然,这一枪从结果来看是失败了,究其原因其实就是高通和微软各打各的算盘,对于微软来说跨架构CPU方案也并不是第一次遇到,Windows NT就曾同时支持过POWER、ALPHA、MIPS等架构,而结果依然是无法撼动x86的地位,所以ARM版Windows PC自然就陷入了开发者不积极、系统支持不给力的局面。

而苹果则完全不同,自己的硬件跑自己的系统,这样的力度显然不是ARM Windows可媲美的,这从以专用芯片来打特定应用的方案就能明确看到,再加上软件系统有针对性地进行优化,交出高能效的答卷并不为奇。

所以,苹果自研Mac芯片的意义其实与A系列芯片于iPhone/iPad的意义相同,A系列处理器再强也并不会明显影响安卓产品线的出货量,M1也同样也无法明显动摇x86 Windows用户群,毕竟使用习惯的惯性是巨大的,再加上M1本身的通用计算性能定位并不算很高,且GPU性能远无法与NVIDIA/AMD GPU抗衡,所以与x86 Windows PC从低到高全覆盖的定位还是有着明显的区别,从这个角度来说,苹果自研Mac芯片很难越界对x86 Windows PC造成影响。

2

借统一硬件平台的东风,性能有望实现快速迭代

虽然M1是苹果第一颗针对电脑产品线的SoC,但却是苹果硬件技术的集大成者。考虑到苹果计划在明年将整个Mac产品线向ARM过渡,这意味着一定会有高功耗的M系列芯片将会推出,而之所以能在这么短时间内实现对英特尔的替代,原因正是依靠A系列处理器“打下的江山”,从台积电的营收占比来看,今年苹果有望达到25%的高点,而M系列与A系列采用同架构方案,这意味着设计、制造等成本可以得到最大幅度的摊销,从而像iPhone那样实现很高的利润率,在台积电最新工艺加持下,能效比也将竞争对手远远甩开,实现用户与企业的双赢。

M1芯片让MacBook的内部设计得以进一步简化

考虑到手机SoC的迭代速度远远快于目前的x86 CPU,所以在明年推出替代英特尔45W TDP CPU的MacBook Pro真的没有太大的意外,但策略应该会与M1保持一致:专用芯片专项优化,同时尽量提高通用计算性能,最重要的是结合第三方应用开发商,特别是苹果最擅长的设计领域应用,比如Adobe系列、Autodesk系列等进行原生优化,这样就能吸引到相当部分的高性能需求群体。如果走到了这一步,那M系列芯片Mac就会对高端x86 Windows PC就会形成冲击了,尤其是英特尔一直在推的“设计师笔记本”。

游戏PC方面,ARM架构的Mac很难对x86 Windows造成影响,这是游戏玩家本身就不属于Mac用户群的长期历史原因导致的,未来预计也很难有变化,毕竟游戏厂商基本上都与AMD或NVIDIA保持着非常紧密的联系,比如CUDA已经基本成为游戏开发的行业标准,Mac在游戏行业的最大作用是打包为iOS APP,再加上NVIDIA和苹果相对糟糕的关系,所以GPU也基本排除了针对ARM架构SoC进行特化的可能,所以这一亩三分地对x86 Windows PC来说,即便是长远来看也是稳稳当当。

3

不可忽视的一点:ARM SoC已是超算第一名

虽然ARM一直都以低功耗平台的形象面对广大消费者,但这并不意味着ARM无法“做大做强”,2020年6月23日拿下超级计算机TOP500排名第一认证的日本“富岳”,就采用了158976个节点的48核心ARM架构富士通A64FX SoC,峰值性能达到了1 EFLOPS,测试结果也有415.5 PFLOPS,也就是一秒可进行41.55亿亿次浮点运算。

而富士通的这颗A64FX采用的就是台积电7nm FinFET制程,87.86亿个晶体管,同时封装了4颗总计32GB HBM2 DRAM,甚至还有2个512bit向量计算单元……其集成度、运算性能和访存带宽都相当强悍,所以ARM不仅能做超算,甚至已经跨过英特尔做到了世界第一。

富士通A64FX采用12x4的组合,并封装了足足32GB HBM2 DRAM,是目前性能最强的ARM SoC

当然,x86这边也不是没有与富士通A64FX类似的设计,英特尔至强Phi就是个例子,同样是高速互联+HBM DRAM的设计,x86有AVX512,ARM有SVE512……不过区别在于富士通成功走上了正轨,至强Phi却几乎“消失在人海”。

所以,即便是在世界上性能需求最大的计算机集群上,ARM也做到了对x86的“超车”,充分证明了ARM高能效比的价值,也意味着在高端个人电脑领域,以苹果为代表的硬软件集成商有着很大的几率凭借高能耗比和快速迭代的先天优势,拿下更多的市场份额,虽然短时间内不大可能去尝试富士通A64FX这种“GPU式”的激进设计,但通过流水线和频率的提升,在当前的设计凭借更好的散热系统来压榨更多性能倒是很有可能。

编辑观点:

在打通手机、平板和电脑的硬软件平台后,苹果接下来可能要走的就是各个平台的边缘模糊化,目前正在做的就是iPad Pro通过蓝牙键盘触控板实现笔记本式的交互,然后通过M系列芯片来融合iPadOS和macOS,获得一台既能运行Mac传统桌面应用,但能效优势相对x86 CPU大幅提升,同时还能和iPadOS、iOS分享触控手势APP操控的融合型设备,这一举措类似于当年iPhone融合iPod、电话、PDA的“壮举”,还挺值得期待的。

(0)

相关推荐