在不久前结束的发布会上,苹果为新款14英寸和16英寸Macbook Pro机型配备了M1 Pro和M1 Max芯片。这两款芯片虽然采用了TSMC 5nm工艺作为M1,但芯片规模却高出数倍,改变了以往苹果“挤牙膏”的风格。
M1 Pro芯片配备最高10核CPU,最高16核GPU,外加最高32GB统一内存,最高200GB/s内存带宽。M1 Max仅配备10核CPU,GPU最高32核,统一内存最高64核,内存带宽最高400GB/s,接近M1集成内存带宽的6倍。
堆叠式10核中央处理器
苹果M1 Pro和M1 Max两款芯片给出的广告口号分别是“快得吓人”和“太快了”。苹果首先对比了上一代M1芯片的速度,称配置齐全的M1 Pro和M1 Max CPU的性能比M1高70%,图形处理器分别高达2倍和4倍。
单从芯片的堆叠来看,这两款芯片真的很恐怖,人们不得不怀疑苹果是不是榨干了TSMC 5nm的产能。M1 Pro芯片封装337亿个晶体管,而M1 Max封装570亿个晶体管。如果将官方给出的对比图进行全比例渲染,M1 Pro的规格为12.8 x 18.5mm,面积为236.8mm2,M1 Max的规格为19.7 x 21.5 mm,即423.6mm2,基于这个预测,M1 Max的芯片密度与M1相近,都在134 MTr/mm2左右,而M1 Pro的晶体管密度略高,达到143MTr/mm2。仅从这些数据来看,苹果还没有达到TSMC 173 mtr/mm2的N5极限。
在CPU配置方面,M1 Pro和M1 Max都配备了8个高性能核心和2个高效核心。苹果官网给出的数据也与x86 8核英特尔芯片笔记本进行了对比。据说在相同功耗水平下,10核CPU的峰值性能是前者的1.8倍,达到峰值水平的功耗要少70%。苹果在备注中也给出了这款对比笔记本的具体型号,是MSI的GP66豹式笔记本,具体型号为11UG-018,英特尔的i7-11800H处理器。
32核GPU直接超越RTX3080?
M1在GPU核心数量上毫不吝啬,堆叠多达32个核心,图形处理速度是M1的4倍。与搭载RTX 3080的大规模高端笔记本相比,同等性能的M1 Max功耗降低了40%。与搭载RTX 3080的轻薄专业笔记本相比,同样性能的M1 Max功耗不到100W W,这造就了M1 Max更好的发热和风扇控制,大大提升了笔记本电脑的续航能力。
需要注意的是,苹果在进行这些性能对比测试时,往往会对Photoshop、Final Cut Pro等后期制作软件进行测试,并不是对显卡性能的完整对比。特别是在视频处理方面,M1 Pro和M1 Max都集成了媒体处理引擎等专用加速硬件,所以在比较视频转码速度时有一些“没有武德”。
Arm PC游戏生态的缺失,苹果Metal图形界面的不成熟,也意味着苹果在游戏性能上还不足以完全超越NVIDIA和AMD。对于一般的性能比较,最好看计算能力。苹果给出的M1 Max GPU峰值计算能力为10.4 TFLOPS,而英伟达的RTX 3060已经达到了12.7 TFLOPS,RTX 3080就更不用说了,所以M1 Pro和M1 Max的图形性能相当“独占”。
在TSMC 3D封装技术的支持下,苹果再次将内存集成到SoC中,实现了视频内存常见的最高64GB的统一内存。更令人惊讶的是,苹果宣称全配置的M1 Max最大内存带宽可以达到400GB/s,而以大带宽著称的HBM2E只有460GB/s的带宽。
然而,苹果统一内存的奥秘已经可以在M1芯片上看到了。M1芯片采用高规格LPDDR4,实现了68.25 GB/s的内存带宽,M1 Max大概也采用了32通道LPDDR R5-6400,并进行了一些“魔改”,实现了400GB/s的内存带宽和512bit位宽。
苹果为新款Macbook Pro系列准备了非常有诚意的芯片阵容,虽然这种性能提升大部分是通过堆叠芯片实现的。在TSMC推迟3纳米制程的窘境下,苹果是否还能玩5纳米,就看是否还剩下其他杀手锏,否则明年就要发布新的牙膏产品了。