打造HPC无尽算力 联想高端解决方案护航中国超算

今年3月4日,中共中央政治局常务委员会召开会议,强调“要加大公共卫生服务、应急物资保障领域投入,加快5G网络、数据中心等新型基础设施建设进度”。而在随后的4月20日,国家发改委对新基建的定义也给出了明确的、权威的说法,其内容包括信息基础设施、融合基础设施和创新基础设施三个方面。

打造HPC无尽算力 联想高端解决方案护航中国超算

由此也意味着“新基建”的大幕正在缓缓拉开,也将数据中心提升到了前所未有的战略高度。面对未来的数字化发展,我们越来越离不开5G、物联网、云计算、人工智能等应用,而这些应用所需要的算力则大多来源于后端的数据中心。换句话说,数据中心成为了数字社会发展的核心,而服务器所提供的算力就成为了“核心的源动力”。

打造HPC无尽算力 联想高端解决方案护航中国超算

日前,中国高性能计算领域规模最大、规格最高的学术研究和应用成果展示盛会——第16届HPC CHINA高性能计算学术年会及主题论坛在河南郑州召开,中国科学院院士曾庆存、中国工程院副院长、工程院院士陈左宁等众多顶级高性能计算专家学者汇聚一堂,共话高性能计算前沿研究应用及未来发展趋势。

打造HPC无尽算力 联想高端解决方案护航中国超算

联想企业科技集团HPC&AI营销总经理于涛

同样是在这次大会上,联想企业科技集团HPC&AI营销总经理于涛做了《联想超算赋能新基建,创造新价值》的主题演讲,全面展示了联想坚持开放、融合的技术路线,并以高效能的HPC解决方案不断推动企业智能化转型,全面赋能“新基建”战略的发展和落地。“超算是信息基础建设的基石,也是创新基础建设的工具”,于涛表示。面向新基建,联想HPC有三大发展愿景:开放、融合、高效。在开放方面,联想企业科技集团将继续坚持软硬件解耦和多平台兼容的产品策略,以Exascale为目标在全球范围内推动技术合作与交流。在融合方面,联想企业科技集团构建的联想智能计算平台LiCO,基于对用户需求的理解,通过产品重构与创新,应对复杂用户场景下的多样化需求。

从风冷到液冷,无法阻挡的计算力飞速发展

正如我们前面提到的,计算力已经成为了智慧时代的生产力,谁能够提供更多的计算力,谁就能够在智慧时代立足。为此,业界也在想方设法提升服务器的算力输出。除了采用更强的芯片、更高规格的处理器之外,也需要更好的控制能耗,因此大多数据中心都从传统的风冷走向了液冷时代。若不如此,要不了多久我们的数据中心甚至整个经济都会被巨大的耗电量而拖垮。

许多人可能觉得能耗问题是危言耸听。不就是浪费点电嘛,我们国家三峡水电站每年那么高的发电量,不用岂不是可惜了?说这话的人可能对数据中心的耗电量一无所知。其实对于数据中心来说,再昂贵的设备采购与运维成本,再多的管理人员成本都只是九牛一毛,而数据中心的年耗电量加在一起将是一个天文数字。

打造HPC无尽算力 联想高端解决方案护航中国超算

据国际环保组织“绿色和平”与华北电力大学近日联合发布了《点亮绿色云端:中国数据中心能耗与可再生能源使用潜力研究》报告显示,2018年中国数据中心总用电量为1,608.89亿千瓦时,占中国全社会用电量的2.35%,超过上海市2018年全社会用电量(1,567亿千瓦时)。而当年三峡水电站的年发电量是1016亿千瓦时,仅能实现用电量的63%。

除了统计数据之外,许多专家对于数据中心耗电量也保持着时刻警惕。中国电子节能技术协会数据中心节能技术委员会秘书长吕天文就曾在某大会上指出,目前中国数据中心的耗电量已连续八年以超过12%的速度增长,预计2020年总耗电量将达到2962亿千瓦,这相当于3个三峡大坝的用电量,数据中心节能问题刻不容缓。

也正因为如此,数据中心的节能问题引发了包括政府在内的广泛关注,北上广深等许多一线城市也在近年陆续发布了面向新建数据中心建设的指导方针和意见,明确表示要将数据中心PUE值控制在1.4甚至1.25以下。如此一来,传统数据中心电气化设计和能效标准已经不再符合需求,整个行业都面临全新的挑战与洗牌。

打造HPC无尽算力 联想高端解决方案护航中国超算

既然数据中心的耗电量这么高,且主要耗电都用来设备制冷,那么我们是否能找到风冷以外的制冷方式呢?于是,更多人将目光投入到液冷设备中来。相对于传统风冷来说,液冷设备采用的冷却液有着远高于空气的比热容,也能够迅速带走设备热量,用更小的耗电带来更好的散热效果。

尤其是在高性能计算的环境中,出于对计算集群性能的超高要求,往往用户都会选择高端处理器等设备,因此带来的热量与能耗也是相当惊人的。为此,许多超级计算机都采用了液冷散热,比如我们熟悉的天河二号、神威太湖之光等等。但是液冷散热解决方案也有高下之分,即便是在最常见的冷板式液冷中,水温的差异就决定了散热的差异。

开业界之先河,联想温水水冷独占鳌头

这就不能不提到联想领先的“温水水冷”技术。所谓“温水水冷”,顾名思义就是通过温水对数据中心的服务器进行散热的技术。之所以采用温水来降温,是联想通过大量实验数据分析认为,进水的温度最高50度,出水温度60度左右,可以获得最佳的能耗比和经济效用,这样服务器的水冷循环系统将实现全年自然冷却,从而大幅降低数据中心PUE值。

打造HPC无尽算力 联想高端解决方案护航中国超算

但是水冷温度的设定是有严格标准的。虽然在实验室环境下可以取得相对宽泛的数值,但是在实际环境中每升高1摄氏度,对于系统稳定性和元器件寿命都会带来莫大的考验。如今,业内常见的温水水冷技术都保持在40-45摄氏度之间,但是联想凭借多年来在HPC领域的积淀及对于温水水冷的深度研发,早已成功实现了50摄氏度的商用化产品,成为了行业的佼佼者。

可不要小看这10%的性能提升。要知道,数据中心散热的温度非常宝贵,据统计数据中心每提升一度,大约会节省4%的能源费用。由此算来,当水温达到50℃的时候,将为数据中心节约大量的能源,大大节约电费开支,提升使用效率。

与温度同样重要的则是冷却液的选择。对于温水水冷来说,冷却液是非常关键的部分,但恰恰现阶段我们对于冷却液腐蚀性,特别是对塑料、光学设备的影响程度还没有明确的定论;相比之下,联想采用的冷板式和热交换式液冷在可维护性、扩展性和未来的升级性上都更为标准化,成本和维护性上都更优秀。

打造HPC无尽算力 联想高端解决方案护航中国超算

为此,联想也提供了根植于“温水水冷”散热技术的三种解决方案——DTN(Directto Node)直接温水冷却、RDHX水冷背门及TTM热转换模块,三者的PUE数值也是从小到大的提升。借助于温水水冷,联想的硬件及软件方案可以提高数据中心的性能,更高效地使用电力,降低运营成本。

DTN(Direct to Node)直接温水冷却是表现效果最好的,通过与处理器及其他部件的直接连接,联想可以实现低至PUE1.1的极限性能,这已经非常接近散热的理论数字;而RDHX后门热交换则是英文Rear DoorHeat EXchanger的缩写,翻译成中文就是“整机柜后门冷却”。这种方式通过安装在整机柜后方的散热门板,提供了整体的散热方式,也减少了数据中心制冷设备的体积和功耗。一般来说,在大型集群或者超大规模数据中心中,这种方式可以起到更好的散热效果。

混合冷却方案主要借助于热转移模块来实现。对于大多数数据中心来说风冷依然是重要的散热方式,因此当气流通过服务器的时候,热转移模块就可以帮助处理器最大可能的实现散热,这也就实现了风冷和液冷的混合冷却模式。

综合看来,正是得益于联想独特的50摄氏度温水水冷设计,使得数据中心并不需要传统意义上的“强力”制冷系统,同时还可以通过混合冷却的方式进一步降低能耗。据统计,采用温水水冷的海神服务器之后,数据中心的性能提升10%,而整体PUE 可以达到惊人的1.1以下,每年节省的电费和排放高达42%。

打造HPC无尽算力 联想高端解决方案护航中国超算

在演讲的最后,于涛还特别提到了联想将在2021年推出的下一代海神水冷服务器。它采用的是并行水流设计,相对于以往的串行设计来说效果更好。而全铜模块的设计和硬连接也是联想一直坚持的“品质之选”,因为这样在安全性的表现更好。而且在异构方面,下一代海神水冷服务器还将支持CPU、GPU、SSD等等部件,适合大功耗、极高密度的部署。

在性能上,全新一代的ThinkSystemSD650-N加载了英伟达HGX-A100 4卡 Baseboard支持最新的NVLINK技术和A100 GPU。其单机柜计算能力达到惊人的3PFlops,计算能力是上一代产品的10倍。其次,由于单节点采用了2颗CPU加4片GPU,并兼顾了CPU和GPU算力的均衡,使得该产品不仅适用于人工智能深度学习的计算,也可以从容应对更为复杂的算力需求环境,在满足HPC对CPU高比例需求的基础上,又能满足对GPU计算的需求。

蝉联中国第一,联想打造HPC金牌解决方案

其实除了温水水冷之外,联想业界领先成就还有不少。许多人提到联想这个名字都会第一时间想到电脑、想到笔记本甚至想到手机,但其实在HPC领域联想也一直是中国的第一名。作为HPC领域的“老兵”,早在2002年,联想就研发了世界上第一台万亿次集群深腾1800,并且成为了第一套入围全球TOP500排名的中国系统,排名第14位。

打造HPC无尽算力 联想高端解决方案护航中国超算

世界上第一台万亿次集群 联想深腾1800

据2020年6月公布的TOP500榜单显示,联想已经超过HPE成为了全球销量的第一名;而在国内,联想也多次荣膺中国TOP100排行榜的份额冠军,可谓是“大满贯”选手。同样从2012年开始,联想HPC成功助力神州九号、十号、十一号飞船成功发射,为载人航天事业保驾护航。

之所以能够获得如此闪亮的成就,是因为联想多年来一直深耕HPC市场,持续技术研发,而刚刚我们介绍的“温水水冷”也只是联想众多能力中的一项。对于超算集群来说,能耗降低只是其中之一,更重要的是日常如何实现有效的管理,让集群能够发挥最大的利用价值。一直以来,许多科研机构和高校都是通过众多的管理人员和三班倒的工作模式保证系统的稳定运行,这在数字化的今天已经显得非常落伍。

打造HPC无尽算力 联想高端解决方案护航中国超算

为此,联想也推出了HPC领域另外的一个杀手锏——LiCO平台。作为联想面向超算集群的智能平台,LiCO平台包括了HPC OS管理平台、AI人工智能平台和Gene探测平台三大部分,集成了计算软件、计算库、调度软件、监控软件、报警软件和分布式文件软件等等。“LiCO有针对HPC的版本,也有针对AI的版本”,于涛说。

正是得益于软硬件的协调工作,使得联想平台无论在性能、能耗还是在管理、应用等多个层面都处于行业前列。在演讲中,于涛特别谈到了今年刚刚部署在某海洋气象研究机构的全新超算系统。这套系统基于温水水冷运行,具备了2016块硬盘的大规模并行存储系统DSS,聚合带宽可以达到120-160GB(平均130GB)几乎没有损失任何的带宽效率,实现天气预报5380倍加速,达到了业界领先的数据水平。

“温水水冷保证了CPU在50-60摄氏度之间,远远低于空气冷区80摄氏度的标准,也帮助我们取得了良好的成绩;而且并行带宽充足,解决了系统运行瓶颈,加之联想专业企业应用团队的支持,三方面结合保证了联想出色的支持服务”,于涛表示。

打造HPC无尽算力 联想高端解决方案护航中国超算

如今,联想在HPC领域中深耕多年,凭借温水水冷、LiCO平台等软硬件优势,联想HPC解决方案已经广泛部署于北京大学、国家卫星海洋中心、西班牙巴塞罗那超级计算中心等科研机构和企业当中,其领域覆盖了科研、教育、气象、大气海洋、石油石化、CAE仿真计算、生命科学、人工智能等等,并在众多行业都占据领导地位。

打造HPC无尽算力 联想高端解决方案护航中国超算

在HPC这条道路上,联想正通过全球顶尖的解决方案,以温水水冷的硬件支持与LiCO软件管理平台为核心,赋能新基建,加速中国从超算大国向超算强国迈进的步伐。

展开阅读全文

页面更新:2024-05-01

标签:冷却液   中国   都会   用电量   耗电量   水冷   摄氏度   基建   温水   集群   数据中心   解决方案   性能   领域   服务器   平台   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top