英特尔至强6+能效核处理器深度解析:用Intel 18A与3D封装打造的多核怪兽

英特尔放出了下一代至强6+能效核处理器,代号Clearwater Forest的更多细节,它采用新一代的Darkmont架构E核,最多可提供288个核心,是其首款基于Intel 18A的服务器处理器,专为超大规模数据中心、云服务提供商和电信运营商打造,帮助企业扩展工作负载、降低能源成本,并驱动更智能的服务,预计将于2026年上半年推出。

Clearwater Forest是当前至强6能效核处理器Sierra Forest的后继产品。由于它仍沿用现有的Birch Stream AP平台,因此在命名上采用至强 6+系列,而非至强7系列,以强调其与至强6家族的延续性和兼容性。

Clearwater Forest也是首款采用Foveros Direct 3D封装工艺的至强处理器,其结构较为复杂:一颗Clearwater Forest处理器共包含12个采用Intel 18A工艺的计算模块。这些计算模块以四个为一组,通过Foveros Direct 3D 装技术安装在3个基础模块上,这些基础模块采用Intel 3工艺,三个基础模块集中在处理器中央,两侧还各有一个采用Intel 7工艺的I/O模块。下层这五个大模块之间采用EMIB 2.5D技术互联。

Intel 18A工艺与Foveros Direct 3D封装技术

Intel 18A是其开发和制造的首个2纳米级别制程节点。与Intel 3制程工艺相比,Intel 18A的每瓦性能提升高达15%,芯片密度提升约30%。该技术通过RibbonFET晶体管和PowerVia背面供电技术显著提升性能与能效。

RibbonFET即GAA全环绕栅极晶体管,它的栅极环绕晶体管沟道,从而能够严格控制沟道中的电流,可以降低漏电流,并提高晶体管开关时的效率,这也有助于降低工作电压。此外,RibbonFET的栅极长度比FinFET短5~10%,并且每个晶体管的功耗降低了20%。

PowerVia背面供电将电源线路移至晶体管背面,传统的晶圆设计是信号线路和电源线路混合放在晶体管上面,这样会带来明显的线路拥塞和功耗损失问题。PowerVia把电源线路移动到晶体管背面,把信号线路和供电线路分离了,这首先消除了信号干扰,有更好的信号完整性。并缩短了晶体管与电源之间的距离,降低了电阻,有效减少了从封装到晶体管之间的压降,最多可 达30%。线路的优化提升了标准单元利用率最多可达10%,从而提升了晶体管密度。

Clearwater Forest在SoC设计中充分利用了Foveros Direct 3D先进封装技术把不同制程的芯粒组合在一起。Foveros Direct 3D可以支持9微米量级的凸点间距,进行铜对铜的键合,可以实现高密度、低电阻的芯片间互联,可以达到0.05pJ/bit的卓越的功耗/比特性能,0.05pJ大概是2.5D技术所能达到的功耗的1/10。

图片上所说的有源硅中间层其实就是指Clearwater Forest的基础模块,它除了能够完成Die和Die之间的互联之外,还引入一些先进的逻辑和存储单元,从而实现更高带宽的跨Die间的互联以及更大的三级缓存。

Clearwater Forest的三大模块

Clearwater Forest所用的Darkmont架构E核也会用在Panther Lake上面,它其实与Lunar Lake和Arrow Lake所用的Skymont架构E核大致相似,但至强6能效核处理器Sierra Forest上用的是Crestmont架构E核,两者差距就非常大了。

上图就列出了Darkmont与Crestmont的具体改进地方,在指令解码、分配、微操作队列、缓存窗口以及指令派发等方面都带来了30%~50%不等的提高。在算力单元,包括标量算术逻辑单元、向量算术逻辑单元、地址生成单元、二级缓存带宽上都实现了翻倍的提升,从4个标量算术逻辑单元提升到8个,向量算术逻辑单元,从2×128bit提升到4×128bit。在诸多改进共同促进下,Darkmont在相同功耗情况下,可以带来17%的IPC性能提升。

相比只有144个Crestmont内核的至强6780E,拥有288个Darkmont内核的至强6+处理器可以带来1.9倍以上的性能提升,同时在整体负载范围之内带来高达23%的能效提升。

和以往的英特尔的E核一样,Darkmont也是四个一组的,它们共享4MB L2缓存。在Clearwater Forest的计算模块上有6组,也就是每个计算模块有24个Darkmont核心。每个基础模块上有4个计算模块,而Clearwater Forest上最多封装三个基础模块,也就是最多拥有24*4*3共288个Darkmont核心。

基础模块采用Intel 3工艺,这些基础模块可不只是用来互联用的,每个基础模块上下两端有四个DDR5内存控制器,三个基础模块组成12通道内存的配置。而且在计算模块的下方还有共享L3缓存,每个计算模块48MB,所以一个基础模块上有192MB,整个Clearwater Forest最多可提供576MB共享L3缓存。

I/O模块是直接用沿用至强6的,采用Intel 7工艺。每个I/O模块上有8个加速器,包括英特尔QuickAssist技术、英特尔动态负载均衡器、英特尔数据流加速器和英特尔内存内分析加速器。还提供48条PCIe 5.0通道,32条CXL 2.0通道, 96条UPI 2.0通道,一共有两个I/O模块所以处理器提供的扩展通道是上面数字的两倍。

Clearwater Forest特性概览

看完Clearwater Forest是如何构成以及如何生成制造之后,我们最后来总结一下这处理器的关键特性。Clearwater Forest提供单路与双路配置,兼容现有的至强6900P平台,可直接使用它们的主板与机架。最多可提供288个E核,最大TDP可达500W,最多288MB L2缓存与576MB L3缓存,支持12通道DDR5-8000内存。可提供96条PCIe 5.0通道,64条CXL 2.0通道,支持多达6个UPI互联。

与Sierra Forest的至强6700E相比,Clearwater Forest的核心数量翻倍,每核心的IPC还提升了17%,提供了5倍容量的L3缓存容量,内存通道数量从8通道增加到12通道,UPI 2.0链路数量从4条增加到6条,内存速率也从6400MT/s提升至8000MT/s。

将Clearwater Forest和第二代的至强处理器对比,现在使用20个机架180台Clearwater Forest服务器就可以替代70个机架1400台第二代英特尔至强服务器,实现相同的算力,实现8:1的服务器整合比例,同时由于服务器和机架功率降低,可以降低整机功耗750KW,降低71%的数据中心占用空间,同时提升3.5倍的性能/功耗比,每台机架上也可以增加2.3倍的虚拟机部署数量。

至强6+处理器系列不仅是一次性能的跃升,更代表了英特尔在能效与集成度上的重大突破。依托Intel 18A先进制程、Foveros Direct 3D封装技术以及全新Darkmont能效核架构,Clearwater Forest在核心密度、内存带宽、互连效率和每瓦性能等多个维度实现了跨越式进步。它在相同功耗下显著提升计算效率,大幅降低数据中心的总体拥有成本。未来至强6+系列将为超大规模云服务商、电信基础设施和AI就绪型工作负载提供坚实底座,并为整个行业树立全新的技术与能效标杆。

展开阅读全文

更新时间:2025-10-13

标签:数码   多核   英特尔   处理器   深度   模块   晶体管   功耗   通道   基础   缓存   单元   机架

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top