重大技术突破!中国新一代神威超算大显身手!

10月23日消息,据外媒vastdata报道,中国科学家已经成功使用自研的人工智能模型和新一代E级(百亿亿次)超级计算机——神威·海洋之光(Oceanlite)在真实分子的尺度上对复杂的量子化学进行建模,这是一项重大的技术突破。相关研究成果已经发表在了IEEE官网上。

通常,很多科学研究的模拟是在超级计算机上进行的,因为它们需要巨大的计算。还有一些类型的研究——例如模拟具有指数级更多相互作用态的分子的量子行为——这就需要算力更强的量子计算机来模拟它们(但是目前量子计算机并不成熟),或者将其简化以使任务适合现代超级计算机。

量子力学中的量子态——由波函数 (Ψ) 描述——这决定了量子系统的所有可能配置,例如分子中电子等粒子的位置、自旋或能级,以及它们的概率。对其进行建模具有挑战性,因为空间状态随着粒子数量的增加呈指数级增长,这使得在我们今天使用的经典超级计算机上进行模拟几乎是不可能的。

为此,科学家们使用各种近似方法来简化量子方程,同时保持描述分子结构、反应和能量的准确性。然而,近似波函数的现有方法的缩放仅限于小分子。

虽然这种量子多体系统可以用神经网络方法求解,但神经网络量子态(NNQS)在大规模电子结构分析中的实际部署面临着挑战,主要是采样成本高和局部能量计算的复杂性。

为了克服这些计算障碍,中国的科学家提出了一种创新的数据并行 NNQS-Transformer 实现方案。他们对 120 个自旋轨道系统进行实验,模拟训练了神经网络来近似分子的波函数,确定电子最有可能在哪里。对于每个采样的电子排列,系统计算局部能量并调整网络,直到其预测与分子的真实量子能量模式相匹配。

中国的科学家通过定制的NNQS-Transformer模型与基于申威(Sunway)SW26010-Pro CPU的神威·海洋之光超级计算机结合,实现了在包含多达 120 个自旋轨道的系统上的全面的量子化学计算。

具体来说,SW26010-Pro是SW26010改进型,拥有6个核心模块和 1 个协议处理单元(PPU)构成,每个模块有1个管理Linux线程的核心(MPE)和64个计算核心,总计384 个内核,相比之下上一代的SW26010 只有 4 个核心组,说明SW26010 pro单芯片应该有50%的性能提升。

SW26010-Pro处理器的384个计算核心当中,每64个(8×8)计算核心网络组成一个具有256KB L2高速缓存的计算处理单元(CPE)。每个CPE有四个逻辑块,可以在一对上支持FP64和FP32,在另一对上则可以支持FP16和BF16。

研究人员设计了一种分层通信模型,其中管理核心负责处理器和节点之间的协调,而数百万个具有512 bit矢量引擎的“轻量级”2-wide计算处理单元(CPE)执行本地量子计算。此外,他们还创建了一个动态负载平衡算法,以确保不均匀的计算负载不会使任何内核空闲。

最终,中国的科学家们在神威·海洋之光的3700万个处理器核心(神威·海洋之光最大的配置超过100000个节点,共有超过4100万个核心,FP16性能超过5 Exaflop/s,FP64的理论峰值性能为1.5 Exaflops)上运行了他们的代码,实现了92%的强扩展性和98%的弱扩展性,对于这样的规模来说,这是一个很高的效率,这突显了开发人员已经找到了软件和硬件之间近乎完美的同步,这是中国超级计算机界的一项重大成就。

迄今为止,对具有120个自旋轨道的分子系统的模拟,是有史以来在经典超级计算机上进行的最大的人工智能驱动的量子化学计算,这标志着使 NNQS 计算在现实世界的量子化学应用中实用化迈出了关键一步,也标志着中国在该领域的重大技术突破。

相关文章:《国产新一代超算“天河星逸”发布:1597.44万核心,峰值性能达620PFLOPS?》

编辑:芯智讯-浪客剑


展开阅读全文

更新时间:2025-10-26

标签:科技   大显身手   神威   新一代   中国   技术   量子   核心   分子   计算机   神经网络   能量   系统   近似

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top