苹果M系列处理器-FreeOA

苹果M系列处理器

2022-06-07 11:16:30

阿炯

2022年6月上旬消息，Apple 在其年度 WWDC 大会上推出了其 M1 处理器的下一代：M2 处理器。M2 采用第二代 TSMC 5nm 技术构建，是一个 8 核 CPU，由 4 个高效核心和 4 个高性能核心组成。性能核心之间共享 16MB 缓存，效率核心之间共享 4MB 缓存。

从外形看，M2 比 M1 大一些，其内部共计集成 200 亿只晶体管，相比 M1 芯片增加了 25% 。据官方介绍，相比 M1，M2 的 CPU 性能提升 18%，GPU 性能提升 35%，神经引擎速度提升 40%。同时，M2 芯片的各项性能都有所提升，包括实现了 100GB/s 统一内存带宽的内存控制器（比 M1 芯片高出 50% ），此外高速统一内存最高可达 24GB。

当然，与友商进行切磋也是有必要的。据 Apple 进行的测试，M2 的性能几乎是 Windows 笔记本电脑中最新 10 核芯片的两倍。

与 PC 中的 12 核芯片相比，M2 仅以四分之一的功耗，便可提供 87% 的峰值性能。

除了性能上的提升外，M2 芯片还搭载了苹果公司的一些新技术，其中强调了以下项目：
神经引擎每秒可处理多达 15.8 万亿次操作，比 M1 多 40% 以上。
媒体引擎包括一个更高带宽的视频解码器，支持 8K H.264 和 HEVC 视频。
强大的 ProRes 视频引擎，可以播放 4K 和 8K 视频的多个流。
最新的 Secure Enclave 提供一流的安全性。
新的图像信号处理器 (ISP) ，可提供更好的图像降噪效果。

可在 APPLE 博客中可以查看 M2 芯片的更详细介绍。

2022年6月11日消息，麻省理工学院安全研究人员采用 PACMAN M1 芯片攻击，成功击败了被称为 Apple Silicon 的“最后一道安全线”。据报道，在设计 M1 芯片时，苹果创建了不同的安全层，每层都旨在防止攻击者成功渗透之前的层。M1 的最后一层是被称为 PAC 的安全功能，可帮助保护 CPU 免受已获得内存访问权限的攻击者的攻击。然而来自麻省理工学院 (MIT) 的团队通过他们称为 PACMAN 的硬件成功地击败了 PAC。这项成果来自计算机科学和人工智能实验室 (CSAIL) 的研究人员。

CSAIL 发现，PAC 安全功能可以通过其开发的硬件攻击来破解，PACMAN 可以找到正确值以成功通过 PAC 的指针身份验证。且由于其 PACMAN 攻击涉及硬件设备，因此软件补丁无法解决问题。该团队表示，该漏洞也存在于其他 ARM 芯片中，而不仅仅是 M1，但还没有机会针对 M2 进行尝试。目前研究团队已将该问题通知苹果，并将在 6 月 18 日的计算机架构国际研讨会上披露更多细节。苹果尚未对此发表评论。

PACMAN 是在 M1 芯片中发现的第三个漏洞。2021年5月，安全研究员赫克托.马丁 (Hector Martin) 发现了一个名为 M1RACLES 的漏洞，该漏洞允许两个应用程序秘密交换数据。上个月，多个大学组成的团队发现了一个名为 Augury 的漏洞，可导致芯片泄漏静态数据，不过目前还没有展示出任何可行的漏洞利用方法。苹果 M1 中新型硬件漏洞：可不留痕迹攻破安全机制。

麻省理工学院计算机科学和人工智能实验室（CSAIL）的科学家发布了一项研究称，发现了一种可以绕过 Apple M1 CPU 上的指针验证机制的新型硬件攻击，称为 PACMAN。根据介绍，M1 芯片使用了指针认证的功能，该功能是针对典型软件漏洞的最后一道防线。在启用指针认证后，通常会危及系统或泄漏私人信息的漏洞会被拦截在其轨道上。目前，苹果已经在其所有基于 ARM 的定制芯片上实施了指针认证。而 MIT 新发现的这一漏洞，则可以在不留痕迹的情况下攻破这最后一道防线。此外，鉴于 PACMAN 利用的是硬件机制，因此没有任何软件补丁可以对其进行修复。MIT 方面表示，苹果的 M2 芯片也支持指针认证，但他们还没有针对其进行相关的攻击测试。

研究指出，攻击者可通过猜出指针认证码（Pointer Authentication Code，PAC）的值并将其禁用来实现 PACMAN 攻击。PAC 是一种加密签名，可以用来确认一个应用程序有没有被恶意篡改。猜测出正确值的难度也并不高，攻击者可以通过 hardware side channel 来检验猜测结果的正确性。“鉴于 PAC 可能的值数量只有这么多，他们发现可以尝试所有的值以找到正确的值”。最重要的是，由于猜测都是在推测执行下发生的，所以攻击不会留下任何痕迹。

“指针认证背后的想法是，如果所有其他的方法都失败了，你仍然可以依靠它来防止攻击者控制你的系统。我们已经证明，作为最后一道防线的指针认证并不像我们曾经认为的那样绝对。当引入指针认证时，一大类 bug 突然变得更难用于攻击。而随着 PACMAN 加重这些 bug 的严重程度，整体攻击面可能会更大。”不过PACMAN 并不会完全绕过 M1 芯片上所有的安全设施；它只能利用指针认证可防止的现有漏洞，并通过找到正确的 PAC 来释放该漏洞在攻击中的真正潜力。正由于 PACMAN 无法在没有现有软件错误的情况下破坏系统，因此研究人员认为大家可以不必恐慌。“到目前为止，还没有人利用 PACMAN 创建端到端攻击。”

值得注意的是，指针认证主要用于保护核心操作系统内核。研究指出，PACMAN 攻击甚至对内核有效，这 “对所有启用指针认证的 ARM 系统上的未来安全工作具有重大影响。未来的 CPU 设计人员在构建未来的安全系统时应该注意考虑这种攻击，开发人员应注意不要仅仅依靠指针认证来保护他们的软件。”MIT CSAIL 计划在 6 月 18 日的国际计算机架构研讨会上正式介绍这一研究。苹果方面在得知此发现后则发布声明表示，“我们要感谢研究人员的合作，因为这个概念证明推进了我们对这些技术的理解。根据我们的分析以及研究人员与我们分享的细节，我们得出的结论是，这个问题不会对我们的用户构成直接风险，而且不足以自行绕过操作系统的安全保护。”

M2 支持的内存上限为什么是24GB而不是16/32GB

一台设备的内存容量，取决于：
CPU/北桥数量
CPU/北桥对应的内存控制器数量
每个内存控制器的通道数量
每个通道下允许的 DIMM 数量
DIMM 下的 Rank 数量
每个 Rank 下的 chip 数量
Chip 下的 Bank 数量
Bank 内的 Row Column 数量

因此，除了三通道之外，理论上一条通道上三条内存，或者一条通道上一条 2R 一条 1R 的同颗粒内存，外加非对称通道的情况，都可以整出非二次幂的容量。

这点看看内存厂商提供了多少 48/96gb 颗粒就知道了，前者就是单颗 6GB，后者是 12GB。从 A12X 回看，由于内存频率不断提升，对走线和散热的要求其实是在不断提高的；如果 SoC 要跨过主板访问内存颗粒，显然对内存控制器里的 PHY、封装基板还有 PCB 基板的要求都是不断提高的。iPad Pro 当初在 LPDDR4X 时代也遇到这个问题，因为芯片发热量大了，而且需要 128bit 宽度，PoP 封装做不了; 而且选择高端 PCB 下外联的方式会增加 PCB 的成本、降低生产良率，进一步降低元器件密度。因此到了 A12X，苹果选择把 LPDDR 颗粒和 SoC 一起封装。这种封装方式这其实和统一内存不是一个概念，更不能显着突破原来内存颗粒的延迟和带宽上限; 只是相对来说更省钱、能跑更好的时序，也能兼顾散热。

毕竟 M1 芯片面积还是大了很多，又要满足 macOS 较大的内存需求，而且封装体积还要继续能上 iPad Pro 平台。因此 M1 的内存颗粒密度可以说显着提升。那本来 LPDDR4 很多桌面机器的 32GB 都是靠着四颗 32bit 位宽 8GB 颗粒做到的，手机 12GB PoP 内存用的是 64bit 位宽 12GB; 苹果要做 2x64bit 宽度，面积还要比原来小，容量还要突破原来的 6GB，只能说顶着当时颗粒的密度上限走，那自然被卡在了 16GB。

到了 M2 时代，LPDDR5 有了更高密度的 DRAM 工艺，自然能做到更大容量，只不过在这么小的面积下，做到 32GB 仍然有一定困难。进一步讲还是产品定位问题。一方面 M2 说到底和 M1 Pro|Max 类似，本质上属于 M1.5 而非 M1 的彻底换代。另外一方面 M2 还是用在 MacBook Air 和 13 寸 MBP 上，这些设备并不是准备像 MBP14/16 那样干超级重的活，加上 macOS 的 ZRAM(内存压缩)/SWAP(内存页面交换) 策略允许比较激进，且 M1/M2 能承受比较高的交换 / 压缩率，自然不会在更大的容量上做文章，甚至同代提供的内存容量就比 Windows 机型少。

Apple M2 for Linux的GCC与LLVM Clang编译器性能对比

科技媒体 Phoronix 在2022年9月上旬对运行在 Linux 上的 Apple M2 芯片的 GCC 和 LLVM Clang 编译器进行了性能测试和对比。此次测试采用的设备是 Apple M2 MacBook Air ，运行基于 Arch 的 Asahi Linux 系统（这是目前唯一能够运行最新 Apple M2 芯片的发行版），测试基于 Linux 5.19 内核，编译器版本分别是 LLVM Clang 14.0.6 和 GCC 12.1，它们都是 Arch/Asahi 最新版本的编译器。在所有测试中，CFLAGS/CXXFLAGS 保持不变，针对 -O3 优化级别。

一共进行了数十种不同的 C/C++ 基准测试，旨在观察在运行 Linux 的 Apple M2 芯片上，GCC 12 和 Clang 14 生成的二进制文件哪个性能更佳。测试结果可见此处。可以看到，尽管 LLVM Clang 被 AArch64 供应商广泛使用，且 Apple 在上游 LLVM 上投入巨资，作为其 Xcode 使用的一部分。但至少在（Asahi）Linux 上运行时，GCC 12 编译器仍有一些二进制文件比 Clang 编译出来的更快，性能更好。当然，LLVM Clang 也不落下风，在相当多程序中的表现超越 GCC 。

小结论：GCC 和 Clang 编译器在不同领域分别有很强的先发优势，如果采用所有测试结果的几何平均值，在运行 Asahi Linux 的 Apple M2 MacBook Air 上进行测试时，GCC 12 比 Clang 14 快了近 7%。

Apple 于6月上旬在 WWDC 2023 大会上揭开了最新芯片 M2 Ultra SoC 的面纱。其性能数据非常夸张，提供 24 个 CPU 核心，最多 76 个核心 GPU，以及高达 192GB 的统一内存，内存带宽为 800GB/s。这款芯片拥有 1340 亿个晶体管，提供 32 核神经引擎。

发布会上称 Apple M2 ultra 的 CPU 速度比 M1 Ultra 快 20%，图形处理速度快 30%。这款最新的芯片搭载在最新的 Mac Pro 电脑上，标记着 Apple 产品线逐步向 Apple Silicon 过渡。据发布会介绍，搭载 Apple M2 ultr 的 Mac Pro ，执行视频转码和复杂 3D 模拟等任务的速度比基于英特尔芯片的 Mac Pro 快 3 倍。若同时开启六个视频 I/O 卡时，它能实现在一台机子上完成 24 个 4K 摄像机信号的读取，并完成实时编码。该机器售价 55999 元起。Asahi Linux 首席开发人员 Hector Martin 在 mastodon 上表示对该 Soc 表示略感失望，觉得苹果公司并没有发布一个新的、更强大的芯片，现有的 M2 ultra 更像是两个 M2 Max SoC 的组合。

Apple于2024年5月上旬发布 M4 芯片，首搭于 2024 款 iPad Pro。

M4 芯片以第二代 3 纳米制程工艺打造，采用 SoC 架构，总计集成 280 亿只晶体管，拥有全新显示引擎，采用 4 大核 + 6 小核 CPU（最高达 10 核），号称 CPU 速度比 M2 提升高达 50%。

M4 芯片最多达 10 核的全新中央处理器，包含最多达 4 个性能核心和 6 个能效核心。新一代核心采用经过改进的分支预测技术，其中高性能核心采用了带宽更高的解码和执行引擎，高能效核心则采用了更深层的执行引擎。两种核心也都采用了性能更强的新一代机器学习加速器。

GPU 方面，M4 芯片的 10 核图形处理器构建于 M3 系列芯片的新一代图形处理器架构之上。首次为 iPad 带来动态缓存、硬件加速光线追踪和硬件加速网格着色功能。相比前代 iPad Pro 搭载的强大 M2 芯片，M4 芯片的中央处理器性能提升最高达 1.5 倍。无论是处理 Logic Pro 中复杂的交响乐项目，还是在 LumaFusion 中为 4K 视频添加对性能要求极高的效果，M4 芯片能为各种专业工作流带来更强劲的性能表现。M4 芯片还集成了 Apple 迄今最快的神经网络引擎，运算速度最高可达每秒 38 万亿次 —— 比 A11 仿生芯片中的初代神经网络引擎提升 60 倍。详情查看官方源稿。

苹果于2025年3月上旬正式发布了迄今打造的最强芯片 M3 Ultra —— 将 Apple 芯片性能提升至新极限。新芯片性能比 M1 Ultra 提升最多达 2.6 倍，最高支持 512 GB 统一内存，创个人电脑内存新高，此外还配备了 Mac 性能最强劲的中央处理器和图形处理器，神经网络引擎核心数量翻倍。

M3 Ultra 芯片亮点：
起步内存 96GB，最高可配置 512GB 内存
内部共集成 1,840 亿个晶体管
支持雷雳 5 连接，数据传输速度最高可达 120 Gb/s，比雷雳 4 提升达 2 倍以上
配备最多 32 核中央处理器，包括 24 颗性能核心和 8 颗能效核心，性能最高可达 M2 Ultra 的 1.5 倍，M1 Ultra 的 1.8 倍
拥有 Apple 芯片中最强的图形处理器，包括最多 80 颗图形处理核心，性能比 M2 Ultra 提升最多达 2 倍，比 M1 Ultra 提升最多达 2.6 倍
采用创新的 UltraFusion 封装架构，通过超过 10,000 个高速连接点，将两枚 M3 Max 晶粒整合在一起，可同时传输超过 10,000 个信号，带来超过 2.5TB/s 的低延迟片间带宽，提供低延迟和高带宽的传输能力
提供了专属的硬件加速 H.264、HEVC 与四个 ProRes 编解码引擎，能够播放最多可达 22 条 8K ProRes 422 视频流
显示引擎支持最多 8 台 Pro Display XDR，呈现超过 1.6 亿颗像素。

曾经的合作伙伴英特尔在2025年4月再陷裁员风暴：继2024年削减1.5万人后，传闻将再裁2.2万员工；新任CEO陈立武一边承诺‘释放工程师力量打造顶尖晶圆厂’，一边推进激进成本削减，剥离Altera获44亿美元输血。回想起2005年6月6英特尔第五任CEO欧德宁穿上英特尔标志性的兔子服（Bunny Suit）工装，风风光光登上苹果WWDC大会，和乔布斯一起宣布：苹果电脑Mac将换用英特尔芯片，真让人唏嘘。

在iPad项目开始运转之初，乔布斯原本计划在iPad中采用英特尔凌动（Atom）芯片，但开发iPod的功臣、酷爱赛博朋克造型的苹果工程师托尼·法德尔（Tony Fadell）竭力反对这一想法，并力挺擅长低功耗的Arm芯片。最终，乔布斯听从了法德尔的建议。乔布斯后来回忆说：“多年来，我们都跟英特尔反映，他们的图形芯片很差劲儿。”一开始，苹果和英特尔一起做出了很棒的东西，但这一合作没继续下去，原因有二：一是乔布斯认为英特尔太慢了，就像蒸汽轮船一样，不是很灵活；二是他不想把什么都教给英特尔，因为担心英特尔可能把苹果的东西卖给其竞争对手。

苹果在2008年收购了一家拥有150人的微处理器设计公司P.A. Semi，并于同年获得Arm芯片技术授权，由此开始基于Arm架构的自研芯片之路。其实早在1990年年末苹果就拥有ARM30%的股份，借势Arm不断成长苹果芯片帝国用自研通用芯片架构陆续触达其每一个产品线。错失移动互联网时代的英特尔会落败给安谋(ARM)吗。

更多关于苹果与Arm的关系说可以参考此处。

上文有说过乔布斯忌惮（Intel）厂商把苹果的东西转卖给其竞争对手，这其实源自来自公开领域所知道的，至少两次好友的“借鉴”相关：

比尔盖茨和乔布斯刚创业的时候曾在一起是很好的朋友，事业上也有一些交集，只是后来乔布斯认为比尔盖茨抄袭了他有关个人电脑图形界面显示窗口的创意（尽管视窗系统是源自施乐公司），由此，两个人产生了较大的隔阂，直至终点。1981年，比尔盖茨参观苹果公司、拜访乔布斯，乔布斯把正在研发的图形界面操作系统的项目展示给盖茨，盖茨嗅觉非常灵敏，觉得这将是一款改变世界的作品。回去后立刻召集工程师秘密研发——Windows，并比苹果提前两个月宣布这一新款操作系统。乔布斯得知后大发雷霆，直呼比尔盖茨是个窃贼，并记恨了他一辈子。一转眼二十多年过去了，与乔布斯私交甚好谷歌的创始人拉里佩奇和谢尔盖布林，在iPhone还没有上市前乔布斯就带他俩看过即将发布的iPhone手机；并且为其二人讲述移动互联网是互联网的未来，以及智能手机在未来扮演的举足轻重的作用。不得不说，拉里佩奇和谢尔盖布林是乔布斯绝对的好学生，他们从乔布斯那里学到了世界的未来，在看到iPhone如此颠覆性的作品和iOS操作系统后，他们立刻做了一个决定：要做智能手机操作系统。随后他们在iPhone发布后，便收购了手机系统公司Android，加入到与苹果的竞争中。尽管乔布斯十分欣赏谷歌的创新并且在企业管理上是谷歌两位创始人的导师，但得知此事后，乔布斯大发雷霆，深恶痛绝的抨击了谷歌的举动，并且断绝与拉里佩奇以及谢尔盖布林的往来，怒斥其为小偷和强盗，并且誓言要与谷歌势不两立。

然而，初期的安卓并不完善，不能够对苹果的iOS系统造成威胁。苹果封闭的生态以及常年的积累，使iPhone一炮走红，谷歌自己是互联网公司，没有制造硬件的基础和做手机市场的经验，所以很难与苹果的iPhone抗争。乔布斯认为这场战争谷歌是没有胜率的。然而，意想不到的是，谷歌调整了战略，他们借鉴了老前辈微软的模式，将安卓系统开源，出售给手机制造商们收取授权费。帮助具有手机制造能力的企业提供智能手机安卓系统。这一举动帮助HTC和三星迅速抢占了智能手机市场，也帮助了中国大小手机企业，如华为、小米、魅族、OPPO、Vivo等能够在智能手机市场上取得竞争的优势。而此举让谷歌的安卓系统占据了全球70%的智能手机市场份额，苹果只有30%左右。乔布斯曾有一句名言:"Good artists copy, great artists steal", 意思是说好的艺术家靠模仿，真正的大师靠偷。不得不说这两个斯坦福毕业的高材生充分地领悟到了乔布斯这位导师智慧的精髓。

苹果发布 M5 芯片：CPU 提升 15%、图形性能提升 30%

苹果于2025年10月中旬正式发布了其全新的 M5 处理器，这款芯片基于台积电的 N3P 制程工艺，配备了 10 核 CPU 和 10 核 GPU。

从 CPU 来看，M5 采用了与 M4 相同的 10 核配置，不同的是采用了 6 个性能核心和 4 个效率核心，虽然核心数量没有变化，但苹果表示 M5 的 CPU 的多线程性能相比 M4 提高了 15%。在 GPU 方面，M5 配备了 10 核 GPU，苹果宣称相比 M4 在图形性能上提高了 30%，另外每个 GPU 内核当中都嵌入了一个神经加速器，协同工作下使得 M5 的计算能力是其前代产品的四倍。

在内存带宽方面，M5 达到了 153GB/s，比 M4 的 120GB/s 提高了 30%，此外由于 M5 支持硬件加速光线追踪，苹果声称支持该功能的应用程序性能将提升高达 45%。NPU 方面保持了 16 核配置，能够在消耗最少电量的情况下提供强大的 AI 性能。苹果表示，M5 的 NPU 将与 CPU 和 GPU 中的神经加速器协同工作，使苹果芯片完全优化用于人工智能相关工作负载。例如使用 Apple Vision Pro，用户可以在 Photos 应用中将 2D 照片转换为空间场景，或者生成一个 Persona，这些操作将更加迅速和高效。

值得注意的是，苹果此次并未发布 M5 Pro 和 M5 Max 芯片，不过 macOS Tahoe 泄露的代码显示，这两款高端芯片将在稍后推出。虽然苹果没有给出具体原因，但有推测称，这可能是因为 M5 Pro 和 M5 Max 采用了新的芯片设计，将 CPU 和 GPU 模块分离，从而允许用户根据工作负载进行完全定制的配置。

全新 Apple M5 最初将为 MacBook Pro、iPad Pro 和 Vision Pro 等新款机型提供支持。更多 Apple M5 详情可访问 Apple 官网。与此同时，上游 Linux 内核对 Apple Silicon 的支持仍然以老旧的 Apple M1/M2 SoC 和设备为主，其余 Asahi Linux 开发人员仍在推进 Apple M3/M4 的升级。当前 Asahi Linux 针对上一代 Apple Silicon 硬件的功能矩阵可通过 AsahiLinux.org 获取。