三分天下有其二,美国E级超算为何偏爱AMD

日前,一条新闻引起了全球超算领域的关注:美国三大E级超算的最后一套,名为El Capitan的超级计算机正式宣布采用AMD平台。

三分天下有其二,美国E级超算为何偏爱AMD

El Capitan超算

来自官方的数据显示,El Capitan超算预计将于2023年投入使用,算力将达2EP(200亿亿次每秒),是现有最快超算算力的10倍,并能够实现4倍的能效进步。劳伦斯·利弗莫尔国家实验室主任Bill Goldstein更是用“无与伦比的计算能力”来描述这套系统。

至此,美国能源部的E级超算竞赛计划(Exascale Computing Initiative)全部浮出水面,其规划的Frontier、Aurora、El Capitan三大E级超算中,有两套都基于AMD平台实现,包括采用AMD提供的CPU和GPU等全套设备,这从侧面印证了AMD在产品技术与市场营销上的成功。

这里我们有必要简单介绍一下美国能源部。如果从字面意思来了解,能源部的主要职责就是统一管理各类能源的勘探、研究、开发和利用,但事实上因为能源勘探需要许多高新技术的支持,所以包括超算在内的许多技术都归属于能源部主导,我们也可以将其理解为美国的“发改委”。

三分天下有其二,美国E级超算为何偏爱AMD

而在多年的技术推动中,美国能源部共计建设了17家国家实验室,以此为美国提供了战略性的科技实力——比如这次El Capitan超级计算机所在的劳伦斯利佛摩尔国家实验室,另外的两大超算Frontier和Aurora则分别位于橡树岭国家实验室和阿贡国家实验室。

虽然有这么多的实验室,但其实在超算领域美国一直有非常深厚的积淀,在此之前也采用过包括英特尔、IBM等多种超算平台。那么,为什么在最关键的、迈向百亿亿次计算的E级超算道路上,美国连续两次选择了AMD?为什么包括IBM在内的其他老牌劲旅都没能入选呢?

这还要从AMD的复兴说起。自2017年推出EPYC(霄龙)系列产品开始,AMD就迎来了发展的春天,特别是在2019年8月宣布的第二代EPYC处理器使得产业都见证了7nm工艺带来的魅力,更创造了前所未有的64核心。对于追求性能的超级计算机来说,自然是求贤若渴。

超级计算,人类无止境的性能追求

乍听起来,超算是一个距离普通人非常遥远的概念,许多人甚至只是在历史书中听到过这个名字。但其实在我们日常的生活中,超算应用的案例数不胜数,比如大家每天关注的天气预报就是得益于超级计算机的运算和推演,而包括现在我们听到的大数据、人工智能等许多概念背后都离不开超级计算机的身影。

在当下的智能化时代,计算力就代表了生产力,而如何选择计算力,也能够直接反应到我们的生产和生活当中。一直以来,超级计算机应用就面临着性能不足的情况,那些运行在超算上的上万核甚至几十几百万核心的超大规模应用如一个个“性能怪兽”,也敦促着开发者们提供更强大的计算性能。

这也就解释了为什么AMD能够在超算应用中更受青睐。得益于7nm工艺,第二代AMD EPYC产品最高可以支持64个核心,这也就代表着在单位的空间密度内,AMD可以提供超过竞争对手一倍的核心数量,也带来了成倍的性能提升。如此一来,那些怪兽级应用也就更能够流畅的运行,并且在最短的时间内输出结果。

三分天下有其二,美国E级超算为何偏爱AMD

JOLIOT-CURIEROME超级计算机

这就能解释为什么超算行业对AMD寄予厚望。距离8月发布仅仅3个月之后,在2019年11月公布的第54届全球超算TOP500榜单中,来自于法国原子能委员会研究中心的超级计算机“JOLIOT-CURIEROME”就在排名中获得了59名的好成绩,这也是第一套上榜的第二代EPYC系列平台,它采用了2262个计算节点,是法国性能最强大的超级计算机。

AMD EPYC+超算云优化=性能翻倍

在中国,AMD也迎来了广阔发展空间。2019年11月28日,北京超级云计算中心国内首套基于第二代AMD EPYC平台的大规模集群首期新资源暨科技云超算云队列新技术发布。据公开资料显示,新系统采用了主频为2.35GHz的第二代AMD EPYC处理器,节点数量超过1000台,核心数量达到64000个,纯CPU峰值性能可达2500万亿次每秒,是迄今为止国内最快的AMD平台。

三分天下有其二,美国E级超算为何偏爱AMD

一直以来,关于AMD平台的兼容性与适配性是大众关注的问题。特别是在高性能计算的科研领域,虽然同为x86架构,但是在实际应用中依然需要进一步的优化和配置,以获得最佳性能。这次,北京超级云计算中心也为采用AMD平台进行计算的用户提供了免费的优化服务。

据负责人陈博士表示,之前有许多用户的程序可能来自于不同的平台,而用户往往对于程序的优化缺乏了解,因此在使用初期成绩并不理想。在了解到这些问题之后,北京超级云计算中心免费为这些用户提供了程序调优工作,针对AMD平台特别是64核心进行了重新配置,最终使得用户的实际应用成绩大幅度提升,甚至出现了性能翻倍的情况。

这样一来,原本那些需要一周甚至十多天才能实现的工作,现在只要三五天即可实现,在节省了计算资源的同时,也帮助用户节省了费用。如今,北京超级云计算中心的AMD平台运转良好,实测性能大大超乎客户预期,每天的运行效率都接近于峰值。

对超算产业来说,美国和中国是两个最大的经济体,也是全球超算大国,除此之外,包括欧洲和日本等国家的超算能力也不可小觑。不过日前有越来越多的消息显示,包括英国爱丁堡超算中心的Archer超级计算机和德国斯图加特高性能计算中心Hawk超级计算机都将采用第二代AMD EPYC平台进行搭建,这也意味着AMD平台已经在全球市场遍地开花。

64核心,超算云平台的高效利器

如果说美国能源部选择AMD是看中了多核心带来的性能优势的话,那么包括中国和欧洲在内的超算中心选择AMD又意味着什么呢?这里我们就必须明确一个概念——超算中心所提供的计算服务,大多也是通过云平台实现的。

这正是AMD的价值所在。我们知道,面对全球云化的大潮,任何一家超算中心或者公司都不能独善其身,作为管理者和运营者,每个人都看重云化时代的性能价值,更看中无论是单个虚拟机还是单个容器的性价比。而当我们注意到这个问题的时候就会发现,AMD提供了一个非常不错的选择。

我们一再强调,第二代AMDEPYC处理器可以提供高达64个物理核心,而在云化平台中这也就意味着最多可以实现64个虚拟机或容器。换句话说,对于超算中心或者超算云平台来说,AMD已经提供了最大化的虚拟化能力,更重要的是这些虚拟化的服务器性能也是领先的。

业界著名的虚拟化公司VMware曾推出过一款名为VMmark的基准测试工具,用于模拟数据中心的常用操作,并以此评价虚拟化环境中多个负载的性能和扩展性。具体说来,VMmark使用tile(每tile包含8台虚拟机)为基本单位,其整体测试得分由每个tile的虚拟化得分和虚拟化架构操作得分两部分组成,分数越高,意味着虚拟机服务响应越好,VMware虚拟化性能就越高。

三分天下有其二,美国E级超算为何偏爱AMD

而根据SPEC测试平台公布的VMMARK 3VIRTUALIZATION测试项目结果,第二代AMD EPYC处理器平台以12.78的成绩获得了第一名,超过竞争对手41.6%,这也就意味着如果进行超算云应用的话,基于第二代AMD EPYC处理器所搭建的虚拟机能够提供41.6%的性能优势;再加上专业团队的调优,最终就能实现我们上面提到的200%的性能提升。

这一点对于商业公司来说至关重要。花同样的钱获得更好的性能,恐怕没人能够拒绝AMD这样的好意,无论在公有云、私有云还是超算云平台上都一样。正因为如此,那些基于核时实现的云服务方式都可以凭借第二代AMD EPYC处理器获得更大的提升,而且对于用户本身来说这些强大的性能也有助于计算时间的大大缩减,可谓是“双赢”的云端解决方案。

如此就解释了为什么AMD能够赢得包括超算中心在内众多用户的支持和喜爱,为什么能够连续拿下美国三大E级超算平台中的两个,这恰恰是得益于第二代AMD EPYC处理器出色的性能表现和多核心的支持。对于超算中心来说,更多的核心数量意味着同时处理更多的信息,获得更好的性能;而对于用户来说,更好的虚拟化表现则意味着更快速的计算效率,效率的提升意味着时间的降低,也就是最大限度降低成本。

卖家多卖钱,买家少花钱,还没有中间商赚差价。这样的AMD EPYC处理器,你怎能不说一句YES?

展开阅读全文

页面更新:2024-05-15

标签:多核   美国   能源部   计算中心   北京   处理器   虚拟机   实验室   核心   性能   计算机   国家   用户   天下   平台   科技   中心

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top