ARM Neoverse系列服务器CPU 手机AP CPU的异同

本文对ARM Neoverse系列服务器CPU做一些初步研究,并尝试比较服务器CPU与手机AP CPU的异同。


首先看一下ARM Neoverse系列CPU的全家福,其中一些主要的CPU会在下文重点介绍。


1、ARM Neoverse N1


ARM在2019年2月首次发布面向服务器的CPU产品:ARM Neoverse N1。


Neoverse N1跟Cortex-A76是同一时代的产品。




图:Cortex-A76架构设计的一些要点



图:Cortex-A76的架构总览



图:Cortex-A76支持DynamIQ,能够组成不同的核心。


关于Cortex-A76参阅10月4日的文章:


ARM微架构的变化(A76A77A78)》


2、ARM Neoverse V1


ARM移动端的Cortex-A系列CPU分为超大核Cortex-X系列,大核Cortex-A7x系列以及小核Cortex-A5x系列。


相应地,Neoverse服务器的产品线也分为追求极致性能的V-Series、追求性能与功耗平衡的N-Series以及追求功耗面积的E-Series。



从架构的角度来看,V1借鉴了Cortex-X1 CPU的设计。


由于Neoverse V系列CPU性能太高,受美国和英国的出口管制,中国企业无法购买ARM Neoverse V系列的CPU,包括Neoverse V1以及后续的Neoverse V2等。


关于Cortex-X1,参阅10月4日的文章:


Arm微结构的变化(X系列计划)》


3、ARM Neoverse N2


Neoverse N2是ARM首款ARMv9系列的服务器CPU。


与移动端的Cortex-A710是同一代的CPU。





A710是Armv9家族的第一颗大核心,A710也是第一次正式引入了SVE2扩展指令集,A710没有放弃32bit的支持,可以同时兼容32bit和64bit应用。


N2相比Neoverse V1,增加了SVE2、Memory Tagging Extension(MTE)等ARMv9一代CPU的新feature。


关于Cortex-A710,参阅10月4日的文章:


Arm微架构的变化(A710A715A510)》


3.1 基于Neoverse N2的服务器产品 2021年10月,平头哥发布倚天710,基于TSMC 5nm工艺,采用128核的Neoverse N2,最高频率3.2GHz,8通道DDR5,峰值总带宽281GB/s,96通道PCIe 5.0。SPECInt 2017跑分440分。


倚天710分为两个die,每个die包含64个CPU core和4个通道的DDR。


根据网上信息,每个die size约310mm2。


倚天710采用2.5D封装进行多die合封,总计600亿晶体管。所使用的总线大概率是与Neoverse N2同一时期的CMN-700,每个die上有一个CMN总线。



4、ARM Neoverse V2


ARM于2022年9月发布Neoverse V2 CPU。


相比Neoverse V1,所支持的最大L2 cache size从1MB提升到2MB。另外支持ARM v9.0的新feature,如SVE2 4x128b。


V2再次借鉴X2的设计。



当然,V2 不仅仅是一个核心,而是一个可以授权的平台规范;借助 CMN-700 互连,被许可厂商可以构建可扩展至 256 个内核和 512 MB 系统级缓存的 V2 CPU,该互连可在所有内核、内存和内存中提供 4 TB/秒的横截面带宽及位于网格上的 I/O 控制器。


NVIDIA此前曾宣布Grace将基于Neoverse设计,因此本周的公告Arm最终证实了长期以来的怀疑,即Grace将基于下一代Neoverse V核心。


除了英伟达和可能的 AWS 之外,谁将获得 V2 核心的许可?


也许任何打算使用 V2 的人都已经在进行自定义设计。


关于Cortex-X2,参阅10月4日的文章:


Arm微结构的变化(X系列计划)》




5、Neoverse E2:Cortex-A510与N2配合使用。






Arm将Cortex-A510 CPU(Arm的小型/高效Cortex CPU内核)与CMN-700网格配对。


此举旨在通过提供N2的替代CPU核心,为服务器运营商/供应商提供更大的灵活性,同时仍提供Arm网格的现代I/O和内存功能。


强调这一点的是,E2系统背板甚至与N2背板兼容。


关于Cortex-A510参阅10月4日的文章:


Arm微架构的变化(A710A715A510)》




6、ARM CMN700 vs CMN600


除了ARM Neoverse系列CPU之外,CMN总线也是ARM服务器架构中的重要组件。


CMN-700相比CMN-600提升了每个die上支持的core数量、mesh的Node数量以及System level cache的容量等。






其中CMN-700所支持的256 cores per die是这样计算的:


CMN-700可以支持128个RN-F(Full coherent的Requesting Node),每个RN-F可以是两个Neoverse CPU core经过CMN-700的CAL(Component Aggregation Layer)组件汇聚成一路。


所以总共支持128 * 2 = 256 cores。


理论上来说,CMN-600可以支持64个RN-F,所以理论上能够支持的core数量应该也能到64 * 2 = 128 cores(实际上会略小于这个值)。


因为Ampere Altra这一代服务器芯片就已经有80个Neoverse N1 core,超出了ARM给出的64 core per die。


ARM给出的说法是这个64 core per die是指直连到Node上的core数量,如果采用CAL的话,可以实现更高的core数量。


如果要实现128 core的服务器芯片,可以选择在一个die上使用CMN-700来构建,也可以通过多die互联。


采用64 core per die,用两个die组成128 core服务器芯片的方式,每个die的size比较小,良率会更高,代价是需要有额外的逻辑实现片间互联。

展开阅读全文

页面更新:2024-05-07

标签:微结构   服务器   系列   异同   网格   总线   内核   架构   数量   核心   文章   手机

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top