美国用4轮技术封锁,没拦住中国超算登顶,目送我们再回世界第一

2026年6月23日德国汉堡的国际超算大会刚公布新一期全球榜单。

国家超级计算深圳中心研制的灵晟超算以每秒219亿亿次的持续双精度浮点性能登顶,比第二名美国劳伦斯利弗莫尔实验室的酋长石超算性能高20%,第三名美国橡树岭实验室的前沿超算被甩开一截。

这是中国超算继2017年神威太湖之光之后,时隔9年再回全球榜首,也是全球首台持续性能突破2EFlops的超算系统。

之前全球超算圈有个默认共识,想冲E级也就是每秒百亿亿次以上的性能,必须走CPU搭配GPU的异构路线,毕竟GPU擅长并行计算,适合给大规模运算提速。

美国的酋长石就是这套逻辑的典型,用AMD的处理器加4万4000多块AMD的加速卡,靠GPU堆出性能。

这套路线还有个隐藏好处,就是高端GPU全攥在美国企业手里,2019年之后对华禁售,相当于美国握着超算的“加速开关”,想卡谁卡谁。

但这套路线有个绕不开的短板,就是CPU和GPU之间要频繁搬运数据,效率天生受限,酋长石的HPL双精度浮点实测效率才64%,相当于硬件性能有36%都耗在数据传输上了。

灵晟偏没走这条主流路,总共搭载4万7000颗华为鲲鹏定制版处理器,零GPU加速卡。

既然买不到高端GPU,干脆绕开这个赛道,在CPU内核里直接内嵌了AI矩阵加速单元,打破传统异构的通信壁垒,相当于给每个干活的“计算单元”配了专属的小加速器,不用把数据搬到别的芯片上处理,省了传输的损耗。最终HPL实测效率干到80.3%,比酋长石高出16个百分点。

同样是纯CPU路线的日本富岳之前也登过顶,但没做内嵌加速的设计,就是普通CPU堆量,HPL效率才60%出头,灵晟相当于把纯CPU路线的效率上限直接捅破了一截。

更接近真实科研场景的HPCG高性能共轭梯度测试,灵晟也拿了第一,说明这套架构不是跑分特调的机器,真能扛生产任务,100%全液冷的设计也让能效比跑到每瓦51到52亿次浮点运算,比富岳高三倍多,整机功耗42.2兆瓦,没有浪费性能。

系统总设计师、国家超级计算深圳中心主任卢宇彤之前介绍过。

灵晟从芯片设计、高速互联网络、操作系统到整机集成,华为带着国内合作伙伴全栈打通,搭载的定制处理器是鲲鹏系列的定制版本,华为这次不是只做了芯片,是把之前做5G基站的互联技术、做鸿蒙的调度逻辑都搬过来了。

超算最难的不是把几万颗CPU拼在一起,是让几万颗芯片同时干活不“打架”,谁做哪步、数据怎么传、不能让有的芯片闲着有的过载。

这个调度逻辑和5G基站协同的逻辑是通的,华为之前能搞定几万座基站的协同调度,挪到几万颗CPU上反而更顺手。

这就是为什么灵晟能用更少的硬件跑出更高的效率,不是单纯堆芯片的功劳,是全栈能力的落地。

美国这四年对着中国超算甩了四轮封锁,本来是想把中国超算摁在E级门槛外,结果反倒逼错了方向。

2015年第一轮禁售英特尔至强Phi用于中国超算,2019年第二轮把国家超算深圳中心、中科曙光、海光列入实体清单禁售超算相关技术,2021年第三轮把E级超算相关技术列入出口管制,2022年第四轮直接禁售高端GPU及超算相关的EDA、制造设备。

四轮下来美国以为中国会死磕GPU赛道,毕竟全球主流都这么走,只要把GPU禁了,中国超算就摸不到E级的边。

结果中国偏没按美国的预设走,绕开GPU搞纯CPU的内嵌加速,反而把纯CPU路线的效率做到了比GPU异构还高,美国自己反而被GPU的红利绑住了,舍不得放弃已经成熟的异构路线,效率上不去,守了6年的榜首就这么被掀了。

2022年美国升级封锁之后,中国就没主动给全球超算排名提交过测试结果,这次选在2026年的德国会场交卷,会址选在欧洲,正好是中美都想拉拢的中间地带。

一方面明着给美国看,你四轮封锁没用,我没跟你卷GPU赛道,自己趟了条新路还比你快。

另一方面给欧洲看,中国超算现在已经全栈自主,之前中法的气候模拟、天文观测的超算合作以后空间更大,相当于分化美国的封锁联盟。

之前还有人拿灵晟在HPL混合精度基准测试排第四说事,觉得是AI性能有短板。

其实不是,是灵晟的定位优先级先保双精度,大气海洋模拟、材料第一性原理、脑科学这些都是双精度需求,内嵌的AI加速单元优先级靠后。

卢宇彤之前也说过,超算发展已经迈入超智融合新阶段,灵晟本来就是按这个方向设计的,后续加国产昇腾加速卡就能补AI性能,现在留着力是适配更多场景,不是卡壳。

现在灵晟已经落地的应用里,1公里分辨率的全球地球系统模拟之前要排美国超算的队,至少要等半个月才能跑上,现在国内自己就能跑。

去年华北防汛的洪水演进模拟,之前要借欧洲的超算排一周,灵晟3天就能出结果,还有十万亿级化合物虚拟筛选、一亿原子的第一性原理计算,平均扩展效率84.4%,都是实打实的生产力,不是摆着看的跑分机器。

之前老有人说美国卡了高端GPU,中国超算就造不出E级的,现在灵晟的2.19EFlops已经把这种论调拍死了,美国这四轮封锁本来想当拦路的,结果站着看了我们登顶,还顺便给全球超算圈开了条新赛道,以后说不定纯CPU内嵌加速的路线会变成主流,美国自己反而要跟着学。

#上头条 聊热点#

信息:2026-06-24 09:08·中国互联网新闻中心官方账号

刷新世界算力新高度 “灵晟”问鼎全球超算TOP500

展开阅读全文

更新时间:2026-06-27

标签:科技   美国   中国   技术   加速卡   效率   性能   华为   全球   路线   芯片   精度

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034903号

Top