天河三号原型机打美国脸了?别再妄自“厉害了我的国”!

前些天,由国防科技大学牵头研制“天河三号E级原型机系统”顺利通过项目课题验收,并将部署在国家超级计算天津中心,逐步进入开放应用阶段。这本是一件可喜可贺的事——中国E级超级计算机的三块拼版又拼上一块。

天河三号原型机打美国脸了?别再妄自“厉害了我的国”!

“天河三号”原型机通过验收引媒体关注

中国E级超算的三块拼版,分别是国防科技大学牵头研制的“天河三号”、国家并行计算机工程技术中心牵头研制的“神威E级”和中科曙光牵头研制的“曙光E级”(由于后两者还没有具体命名,暂以“神威E级”和“曙光E级”代替)

在“天河三号”E级原型机通过验收的前几天,神威E级原型机已经运抵国家超级计算济南中心开始安装。按照原计划,“曙光E级”原型机也应在今年5月完成,至于为何目前尚无消息,可能与其芯片路线有关。

然而,就在这件可喜可贺的事儿上,又有媒体(如“环球时报”公号推送《《感谢美国政府,中国在下代超算中领先关键一步》》)借机“歪楼”了,说什么“‘天河三号’原型机打了美国政府的脸”“中国在E级超算中领先了关键一步”等等,让人怎么看怎么不舒服。

一、打脸美国?想多了

说“‘天河三号’原型机打了美国政府的脸”“美国搬石头砸了自己的脚”,无非是因为2015年4月美国商务部决定限制英特尔对中国四家超算单位(国家超级计算广州中心、长沙中心、天津中心和国防科技大学)出售“至强”处理器芯片(至强和至强 Phi),如今“天河三号”原型机通过采用自主芯片和自主操作系统完成了部署,而英特尔的至强Phi,曾于2017年6月价格腰斩(环时一文中将日期错写成2016年6月),今年“正式停产”。

在环时推送的文章中,作者以笃定的语气写道:“笔者毫不怀疑,Intel停产Xeon Phi产品线的重要原因之一是失去了中国超算的市场。”

天河三号原型机打美国脸了?别再妄自“厉害了我的国”!

“至强Phi”在超算系统中扮演“僚机”角色

将“至强phi处理器价格腰斩和停产”与“限制令”联系在一起,未免有些牵强。

一则,中国“天河二号”已经采购了英特尔3.2万颗至强处理器和4.8万颗至强Phi处理器,不会再有一台“天河二号”采购如此多的英特尔芯片,美国“限制令”的举动只是限制“天河二号”的升级,除四家外并不限制其他;

二则,从时间上看,美国的“限制令”是2015年4月,而至强Phi价格大幅下降是在2017年6月,停产是2018年7月,时隔时间太久,说是“限制令”导致的结果不能令人信服。

此外,英特尔至强phi处理器有多种类型,且并不仅仅供货于超算系统。

笔者认为,至强Phi退市的背后有内外两条重要因素。外因是,受到了英伟达的冲击。英伟达发布了基于Volta架构的计算平台之后,至强phi竞争力大减;内因则是,英特尔正在着手替代方案。一方面,英特尔看到了FPGA芯片在深度学习上的优势,收购了FPGA厂商Altera后有将FPGA和CPU进行融合来达到更高的运算能力的意图;另一方面,英特尔也在招兵买马研发独立的GPU项目。

天河三号原型机打美国脸了?别再妄自“厉害了我的国”!

最新一期全球超算Top500榜单,有96个使用NVIDIA GPU做加速器,其中前10中占5个

环时一文中所谓的“打脸”,还剑指美国“限制令”后,中国超算凭借自主研发的“神威·太湖之光”在全球超算Top500上“霸榜”两年。且不说“神威·太湖之光”本就跟“限制令”没关系,“天河三号”原型机的顺利验收也不是中国超算“嘚瑟”的资本。

从“天河二号”到“天河三号”原型机,与其说经历了从“依赖”到“自主”,不如说是经历了一场“挫折教育”——让中国超算在持续领跑“第一”的时候清醒了一下,倒逼我国进行自主创新。

现在尤其是应该头脑清醒的时刻,如果认为这就算是“打脸美国”,那这跟“中兴事件”之前的“厉害了我的国”的论调有什么区别?

二、中国不一定率先建成E级超算

再回看一下环时文章的标题《感谢美国政府,中国在下代超算中领先关键一步》。这种标题给人的误导是,中国已经在E级超算的研制中领先了。

说中国超算当自强也就罢了,说“领先一步”就有点意淫了。

首先,核心部件的自主化只是初步目标。科技部在设立“国家‘十三五’高性能计算专项课题”时,就已经明确了要“依托自主可控技术,研制适应重大应用需求的E级高性能计算机系统”。其实后边还有一个目标:“同时研发一批关键领域/行业的高性能计算应用软件,构建高性能计算机应用生态环境”。“天河三号”原型机的验收,只是我们在第一个目标上有了初步成果,后边的目标才是关键,而这一目标还有待进一步努力。

其次,中国并没有在E级超算的研制中领先美国。笔者注意到,公开披露的E级超算的原型机,无论是“天河三号”还是“神威E级”的原型机,都没有将计算性能放在显眼位置来宣传(神威E级的原型机据报计算力在4PFlops左右,不到“太湖之光”的1/20),这也从侧面说明原型机距离真正的E级还差得很远。

当然,原型机本来就是预研项目,是为大规模系统“探路”和“试错”的,没必要纠结规模大小。但要明确的是,从原型系统到E级,难度是几何倍数增加的。原型系统不可能暴露所有的问题,随着建设规模的增加,遇到的问题将会越来越棘手。

反观美国,该国能源部橡树岭国家实验室的超算设备已经升级至187PFlops,另有两套超算系统亦或于年内升级至同等水平。考虑到实现E级超算要面对功耗墙、存储墙、可编程墙、可靠性墙等重大挑战,从这个水平到E级(1000PFlops)显然更稳健。同时,美国不止能源部有超算研发投入,美国国家科学基金会和美国陆军研究实验室等单位也部署有中长远期的超算系统的研发计划,在E级计算研发这条路上,美国明显领先于中国。

天河三号原型机打美国脸了?别再妄自“厉害了我的国”!

“Summit”助美国重夺世界第一超算

此外,欧洲、日本等也是E级超算研制队伍中的重要力量,难保不会率先祭出E级系统。希望各方——特别是媒体,不要以为中国舍得投入,就胜券在握了。

三、超算芯片自主化≠中国芯的胜利

“天河三号”原型机顺利通过验收之所以让许多媒体青眼有加,无外乎它给人们传递了这样一个信号,中国下一代超级计算机将完全实现自主研发,特别是核心处理器方面,将全部实现国产化替代。

天河三号原型机打美国脸了?别再妄自“厉害了我的国”!

“中国芯”要在E级超算挑大梁

时至今日,中国E级超算“三驾马车”的核心处理器的国产化方案都有了着落:“天河三号”将使用国防科技大学创业公司飞腾设计生产的CPU和相应的加速芯片,“神威E级”将延续“太湖之光”此前的自主能力而采用申威CPU,“曙光E级”不出意外将采用旗下控股子公司海光(与AMD合资)生产的x86架构CPU(环时提到了曙光E级也可能采用龙芯,虽然龙芯系列CPU有在高性能计算机应用的潜力,但笔者认为此方案可能性不大)

上述三款,飞腾和申威是三大国字号芯片队伍之二,其中飞腾因2015年发布了世界上第一款基于ARM架构的64核CPU而名声大噪,近年来在产品性能上的进步也非常明显;申威则因其军工背景显得神秘而低调,但其选择的ALPHA指令集存在着生态环境弱的劣势。至于海光,本就有点横空出世的感觉,对自家CPU更是讳莫如深。有外媒报道AMD并没有兜售海光最新的Zen架构等核心技术,还有人质疑海光CPU是否AMD马甲等,对这些声音目前尚无进一步的官方信息。

三大超算势力“突然”都有了国产芯片保驾护航,这跟“中兴事件”时的画风迥然不同,不免给人一种中国芯涅槃重生的既视感。不过,在超算设备上的国产化替代,并不代表着中国芯已经崛起,国产芯片前路还很长。

原因有三。

首先,超算用CPU并非代表CPU最高水平。相比消费级的嵌入式低功耗通用CPU和对性能和稳定性要求更苛刻的企业级服务器CPU,超级计算机用的大型多核并行CPU相对更容易实现。

其次,芯片的国产化替代不仅仅是“换芯”。中国在芯片领域的差距不可能靠换一代芯片就能弥补得了的,而是需要一代代地迭代升级,把国产处理器应用的生态环境、产业链建立起来。这不是简单地发展硬件的问题,而是软硬件、生态环境、使用环境、产业链的系统问题,需要持续的投入和发展。

另外,超算用的国产化芯片,每年使用量非常有限,并不能支持国产芯片的迭代创新,也难以带来丰厚市场回报。一言以蔽之,国产芯片距离迎来光明时刻还要很久,各方须保持足够的耐心。

四、不要忘了为什么研制超算

最后说一点,不要忘了我们为什么要研制超算。不能为了建造E级而建造,超算最终还要回归应用。也就是说,我们投入巨资建造E级超算,必须要在“用好”这方面提前做足功课。

超级计算机虽说不至于“自古名将如美人,不许人间见白头”,但再好的水果,不及时吃就会烂掉。对于中国的“超算”来说,这个“果子”已经比较“好看”,但如何做到“吃好”才是更重要的问题。

笔者曾在采访杰克·唐加拉时得到这样的回复:

“美国项目的优势在于不仅在硬件功能,而且在开发运用高性能计算对现实世界的科学和工业应用软件的能力。美国科学家用能源部超级计算机的能力,来提高太阳能电池的性能、设计制作电池的新材料、模拟冰盖的融化、帮助为生物燃料作物优化土地用途、模拟超新星爆炸、开发出近零摩擦的润滑剂和提升对癌症的激光辐射治疗效果,以及其他无数应用。”

且不说我国大型超算系统的利用率低的问题,在全球超算Top500的榜单上,中国上榜的超算多数部署在互联网企业和一些国字头企业,高校、院所等研究机构的部署相比美国少之又少。这从侧面反映出,我们的超算,可能“好钢没有用到刀刃上”。

总体而言,我国的超级计算机应用和国外相比仍有不小的差距,如何将“制好”优势转化为“用好”优势,在解决国防与科学重大需求的同时,带动产业创新与发展是超算中心今后的核心任务。

展开阅读全文

页面更新:2024-03-17

标签:天河   美国   美国政府   太湖   英特尔   曙光   国防科技   神威   中国   处理器   芯片   厉害   自主   计算机   国家   财经   系统

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top