Arrow Lake-S：NPU加持，分离模块设计，核心架构大改

就在前段时间的COMPUTEX 2024上，英特尔发布了全新的处理器架构Lunar Lake，这其实是面向移动端所设计的，相比去年9月推出的Meteor Lake，在CPU、GPU与NPU都有不同幅度的性能提升，并且在能效比方面做出了很大的改进。搭载Lunar Lake处理器的轻薄本将于下半年陆续上市，不过一起到来的还有Arrow Lake，根据英特尔之前公布的计划，下一代Arrow Lake处理器将在2024年内发布。Arrow Lake涵盖了台式机和笔记本电脑产品的多个细分平台，其中“S”用于台式机，“HX”则用于发烧级游戏本，两者可看作相同芯片因面向不同平台而选择不同的封装。

值得一提的是，Arrow Lake和Lunar Lake，这两个平台在制程和架构上基本一致，只是分别针对高性能和低功耗市场。因此我们可以根据现有的Lunar Lake架构，我们或许可以一窥即将到来的Arrow Lake-S将会有怎样的改进。

改用LGA 1851接口

首先Arrow Lake-S会换用新的接口，LGA 1851接口整体上接近于现有的LGA 1700，只不过细节方面有所变化。其中最大的变化就是接触焊盘的凸块数量从1700增加到1851个，同比增加了9%。不过插槽本身的尺寸并未发生变化，依然为 37.5mm×45mm。

根据LGA 1851的针脚定义可以看到，Arrow Lake-S支持16条PCIe 5.0通道，由CPU提供，由独立显卡使用，其次还有4条PCIe 5.0以及4条PCIe 4.0通道由IO模块提供。芯片组则支持14条PCIe 4.0通道、10个USB3以及13个USB2，其中PCIe通道可拆分用于不同数量的SATA、GbE。

分离式模块化设计

除了接口换了，设计上也不同于上代Raptor Lake-S。众所周知，Meteor Lake开创了Intel模块化设计的先河，前段时间发布的Lunar Lake延续了Meteor Lake的模块化设计，不过在设计上没有像Meteor Lake那样将模块细分的很碎。本以为Arrow Lake-S在架构设计上应该与Lunar Lake差不多，不过根据现有信息的爆料，Arrow Lake-S的处理器架构可能更像Meteor Lake一些，整体为4个主要模块，包括CPU Tile、SoC Tile、GPU Tile以及IOE Tile，它们通过Foveros技术连接到基础模块（Base Tile）之上。

反观Lunar Lake的架构设计只有两个模块，分别是计算模块与平台控制模块，其中计算模块包含了CPU、GPU、NPU、媒体引擎、显示引擎、内存缓存等。

爆料图中的SoC和IOE模块是Lunar Lake所不具备的，这也是Arrow Lake提供更高IO扩展能力的关键所在。因此Arrow Lake系列处理器将提供多样化的配置选项，以满足不同平台的需求。

全新CPU架构

Arrow Lake-S还是延续大小核设计，至高拥有24个核心，其中8个为性能核心，也就是我们俗称的P核，剩余的16核心则是能效核心，也就是E核。

不过Arrow Lake-S将有大升级，P核将由Raptor Cove微架构升级成Lunar Lake同款的Lion Cove微架构。

从上面的架构图里可以看到Lion Cove的缓存结构改动很大，Lion Cove使用了全新的多层数据缓存设计，在L1数据缓存与L2缓存之间加了一层缓存，缓存的主要作用是临时存储CPU可能需要快速访问的预取数据，更大更多的缓存是为了避免因为RAM的限制而造成CPU的性能瓶颈，特别是在处理像游戏等特定任务时尤为明显。

其次P核还有一个改变就是取消了超线程技术（Hyper-Threading Technology，HTT），这项技术已经跟了英特尔20多年的时间。

发布Lunar Lake时，英特尔就提到，取消超线程更多是因为出于能效比的决定。英特尔测试开启超线程时，相同芯片面积下虽然可以增加30%的IPC，但代价是增加20%的功耗。过去需要超线程更多是因为E核的性能比较弱，而现在新处理器的P核与E核之间的差距，已经没有过去那么大了，直接用E核去承担更多的多线程运算，会比用超线程更划算一些。

E核也进行了大改，由Alder Lake一直沿用的Gracemont微架构升级为了Skymont微架构。以Lunar Lake里的数据来看，全新基于Skymont架构打造的E核在性能上应该不输Raptor Lake-S的Raptor Cove P核，甚至在部分工作场景下战斗力更胜一筹。

与Raptor Cove相比，Skymont的单线程整数与浮点性能都高出2%，并且Skymont能用更低的功耗实现与Raptor Cove同等的性能。虽然Raptor Cove能够实现更高的功率上限，但Skymont作为能效E核，有媲美Raptor Cove P核的表现已经足够了。

另外，Lunar Lake中的E核更多是依照轻薄本所需要的低功耗而设计，更像Meteor Lake里的LP E核，而Arrow Lake-S作为桌面端平台，显然不需要考虑这一点，因此英特尔可能不会限制Arrow Lake-S里的E核的功率上限，它在台式机上的定位可能更像一颗“准”P核。

甚至在Arrow Lake-S的E核集群里，英特尔还将配备了专用的L3缓存，这一点也是Lunar Lake所没有的。

除了大小核的架构有改进，Arrow Lake-S的缓存容量也有提升，以最顶级的处理器来看，8个P核的L2缓存为24MB，L3缓存也有24MB；16个E核的L2缓存为16MB，L3缓存为12MB，总缓存可以来到76MB，相比起Raptor Lake-S时的68MB来说，增幅为12%，算是不小的提升了。

全新的Xe GPU核显

过去英特尔的核心一直都为人所诟病，当然其中一个重要的原因就是性能的不给力。好消息是Arrow Lake-S采用了代号为Battlemage的Xe2架构核显，这是英特尔最新的GPU架构，也是未来ARC B系列独显的核心。有一说一，单核显架构的升级就可以说是史诗级的进步。

不过Arrow Lake-S的核心与Lunar Lake还是有差距，Lunar Lake的GPU结构包含8组Xe核心，但据目前消息，Arrow Lake-S则最多只有4组Xe核心，可能是考虑到台式机用户一般都会配备独立显卡，因此4组Xe核心已经能够满足亮机的需求了。

我们测试锐炫独显时，其XMX矩阵引擎提供了不俗的游戏性能与AI算力。现在Arrow Lake-S上的这颗核显也集成了XMX矩阵引擎，每个Xe 核心包含八个XMX矩阵引擎，每个XMX矩阵引擎又有2048比特的宽度，并且每颗核心还配备192KB的L1缓存。台式机的核显性能未来可期！

性能上对比Raptor Lake-S上的UHD770，应该说是史诗级的提升。毕竟新一代Xe2 GPU能让Lunar Lake提供比Meteor Lake约1.5倍的图形性能，虽然Arrow Lake-S上的核心数砍半了，但对比羸弱的UHD770应该还是爆杀。

另外，全新的Xe GPU核显媒体引擎还会支持AV1的视频编解码能力，最高可支持8K60 10bit HDR视频编解码，最新的H.266(VVC)视频格式的解码能力也会得到支持。显示引擎则可以支持eDP 1.5、DP 2.1和HDMI 2.1接口标准。至于实际的游戏性能提升，大家还需要等到Intel未来的发布会上才能知晓。

桌面端也有NPU加持

如果说这两年的科技行业什么最火，无疑就是AI，尤其是以OpenAI为主的GPT模型更是改变了整个行业。英特尔在移动端的Meteor Lake、Lunar Lake都引入了NPU设计，也就是说，现在Intel的移动端处理器，无论是CPU、GPU还是NPU都能从事AI运算，并且英特尔还为不同的场景划分了不同的AI单元支持，例如轻量级的应用只需要CPU就可以完成，而复杂AI则需要高性能的GPU。至于NPU，则主打高效与低功耗场合。

移动端的NPU混得风生水起，现在桌面端也将用上NPU设计。Arrow Lake-S将是Intel桌面端处理器首次引入NPU模块，与隔壁AMD的Ryzen 8000G系列类似。NPU的意义主要在于以低功耗提供较高的AI性能，减少对笔记本续航时间的影响，桌面端引入NPU的意义我们暂时还不知道，在个人PC领域，对“本地AI”的应用尚在探索阶段，NPU将以何种方式改善体验，目前还是个未知数。但是无论如何，英特尔给Arrow Lake-S加上NPU的操作就证明，已为未来做好了准备。

不过Arrow Lake-S上的NPU算力并没有像Lunar Lake那么高，根据爆料信息来看，Arrow Lake-S 的NPU算力仅有13 TOPS，甚至还不如 CPU 部分能够提供的性能，对比50 TOPS 的Strix Point Ryzen AI 300系列处理器更是遥不可及。

虽然在NPU的AI算力上不及Lunar Lake，不过引入NPU模块完全可以说是台式机领域的一大尝试，显示出英特尔在AI加速技术上的持续进步。并且NPU性能仅仅只是AI能力的一部分，处理器的CPU与核显仍有一定的AI性能，从爆料的信息可以看到Arrow Lake-S中，CPU的AI算力可达15 TOPS，XE核显也能提供9 TOPS的算力，总共有37 TOPS的AI总算力，相比起前代Raptor Lake-S的11 TOPS，已经超出3倍有多了。

ITD引入AI协助

另外，由于从12代酷睿开始，英特尔引入了大小核架构，怎么去管理和调用这些核心一直是英特尔迫切需要解决和改善的问题。不过在Lunar Lake上，英特尔给出了响应的解决方案——英特尔硬件线程调度器。

在Lunar Lake上，英特尔的调度策略为E核优先，当负载较高时再移向P核心。Lunar Lake的主要设计取向就是高能效比，是用于追求续航能力的轻薄本使用的处理器，这样的调度逻辑也符合目标产品以及目标用户的需要。

但是Arrow Lake-S是面向高性能的台式机处理器，其调度策略应该会与Lunar Lake不同。作为台式机处理器，功耗并非第一考虑要素，因此英特尔更可能以效率为优先。Arrow Lake-S应该会延续Lunar Lake的部分策略，即优先把任务分配给E核，在需求更高的性能的时候才会把任务移动到P核上，不过现在的Skymont架构E核性能暴涨，这使大部分日常工作负载可在E核上完成，只有在非常重载的情况才会启用P核。

除此之外，英特尔应该还会引入AI技术进行预测，可以更准确地预测线程的运行模式，从而进行更智能的线程调度；新的硬件线程调度器应该还会识别每个工作负载的级别，并使用其P核和E核的评分机制，将线程调度到性能和效率最佳的内核上。

总而言之，Arrow Lake-S的硬件线程调度器相比上一代Raptor Lake-S进行了多方面的改进，使其能够更智能、更灵活地进行线程调度，从而提升处理器性能和能效，并提升用户体验。

另外，值得一提的是，过去英特尔的前三代大小核架构都采用环形总线排列，共享L3缓存。这样的设计容易导致P核通常位于芯片的一个区域，而E核集群又位于芯片的另一区域，当任务由E核转移至P核时不仅距离远，延迟也会变高。所以过去的12代、13代、14代酷睿都是默认进程优先跑在P核，算力过剩再转到E核。

而Arrow Lake-S会改变现在这种布置，P核与E核集群改成交错布置的形式，类似下图这种，这种设计跟Meteor Lake或Lunar Lake类似。这样的设计有助于降低它们之间的通信延迟，这样调度策略上优先安排到E核上就变得合理了，这样即便性能不足，需要转移至P核上，无论是距离还是延迟，都比过往更加简单。并且优先E核的策略还能降低功耗，一举多得。

其他细节

另外，根据目前爆料的信息来看，Arrow Lake-S的型号非常多，足足有18款。最新情报显示桌面版的Arrow Lake-S将会有B0、C0两个版本的芯片，继续分为125W、65W、35W三个级别。

其中，B0是高端核心，用于酷睿Ultra 9/7系列以及125W版本的酷睿Ultra 5，规格上最多配备8P+16E 24核心24线程、4个Xe核显核心。C0则是低端核心，只会用于65W或35W的酷睿Ultra 5，最多6P+8E 14核心14线程、4个Xe核心。不过根据@Jaykihn的爆料信息来看，65W版本的酷睿Ultra 5存在B0以及C0芯片混用的情况，这可能也是为了节约晶片的考虑。

VC根据现有情报汇总了Arrow Lake-S的型号以及规格信息，总共有18款之多，其中酷睿Ultra 9有三款，有类似之前K系列的125W，也有65W以及类似T系列的35W版本。酷睿Ultra 7则有6款，每个TDP各有2款，不过好在核心没有动刀，都是8P+12E 20核心20线程设计，只有核显部分有区别，分为4XE核心以及无核显版本。至于酷睿Ultra 5就厉害了，型号非常多，光CPU核心就能分成6P+8E以及6P+4E两种，核显更是五花八门，排列组合一下，多到数不清。

Intel 800系主板的规格也逐渐清晰，800系家族会包括面向消费端的高中低端产品Z890、B860、H810，而W880和Q870则是面向工作站以及企业设计。其中入门级的H810升级巨大，提供了PCIe 5.0支持，不过依旧不支持内存超频。至于CPU超频依旧是Z890的专属，W880 则将是唯一支持 DDR5 ECC 内存的芯片组。

另外，根据主板规格信息可以看出Arrow Lake-S依旧不支持雷电5，仅支持雷电4，与Lunar Lake一致，这一点还是比较可惜的。

结语

总的来说，新一代Arrow Lake-S系列处理器的推出将会是英特尔在台式机处理器上的一次重大革新。全新的分离式模块化设计，使得处理器的各个部分可以更灵活地进行优化和更新；革新的CPU大小核架构，不仅提升了多任务处理能力，也有效地平衡了能效和性能；卓越的Xe核显引入，为图形处理和多媒体应用提供了更高的效率和更好的视觉体验；甚至还有热门的NPU模块，进一步提升了AI处理能力，为人工智能应用的更广阔应用场景提供了可能。作为酷睿Ultra品牌的代表，新一代Arrow Lake-S处理器无疑将为未来的计算机行业带来新的发展机遇和挑战。让我们期待这款处理器的正式发布，看看英特尔如何在未来继续引领创新潮流。