NVIDIA发布的首款安培GPU有五大突破创新

2020年5月14日：NVIDIA宣布首款基于NVIDIA Ampere（安培）架构的GPU —— NVIDIA A100，A100集AI训练和推理于一身，并且其性能相比于前代产品提升了高达20倍。作为一款通用型工作负载加速器，A100还被设计用于数据分析、科学计算和云图形。

A100所采用的全新弹性计算技术能够为每项工作分配适量的计算能力。多实例GPU技术可将每个A100 GPU分割为多达七个独立实例来执行推理任务，而第三代NVIDIA NVLink互联技术能够将多个A100 GPU合并成一个巨大的GPU来执行更大规模的训练任务。

A100的五大突破

NVIDIA A100 GPU的突破性技术设计来源于五大关键性创新

1，NVIDIA Ampere架构 - A100的核心是NVIDIA Ampere GPU架构，该架构包含超过540亿个晶体管，这使其成为全球最大的7纳米处理器。

2，具有TF32的第三代Tensor Core核心 - NVIDIA广泛采用的Tensor Core核心现在已变得更加灵活、快速且易于使用。其功能经过扩展后加入了专为AI开发的全新TF32，它能在无需更改任何代码的情况下，使FP32精度下的AI性能提高多达20倍。此外，Tensor Core核心现在支持FP64精度，相比于前代，其为HPC应用所提供的计算力比之前提高了多达2.5倍。

3，多实例GPU - MIG，一种全新技术功能，可将单个A100 GPU分割为多达七个独立的GPU，为不同规模的工作提供不同的计算力，以此实现最佳利用率和投资回报率的最大化。

4，第三代NVIDIA NVLink - 使GPU之间的高速联接增加至原来的两倍，实现服务器的高效性能扩展。

5，结构化稀疏 - 这种全新效率技术利用AI数学固有的稀疏性，使性能提升了一倍。

基于A100的NVIDIA DGX A100系统和HGX A100服务器构建模块

同时发布的还有NVIDIA DGX A100 系统，其内置8个由NVIDIA NVLink互联的NVIDIA A100 GPU。NVIDIA和官方合作伙伴现已开始供应该系统。

为帮助合作伙伴加快服务器的开发，NVIDIA开发了HGX A100服务器构建模块，该模块采用了多GPU配置的集成基板形式。

HGX A100 4-GPU通过NVLink实现GPU之间的完整互联， 8-GPU配置的HGX A100通过NVIDIA NVSwitch实现GPU之间的全带宽通信。采用全新MIG 技术的HGX A100能够被分割为56个小型GPU，每个GPU的速度都比NVIDIA T4更快；或者也可以将其用作一台拥有10petaflops AI性能的巨型8-GPU服务器。

阿里云、AWS、百度智能云、Google Cloud、Microsoft Azure 、甲骨文和腾讯云正在计划提供基于A100的服务。此外，众多全球领先的系统制造商也将提供各种基于A100的服务器。

展开阅读全文

页面更新：2024-05-26

标签：安培前代稀疏精度架构实例模块合作伙伴独立性能核心服务器数码工作系统技术

1 2 3 4 5

NVIDIA发布的首款安培GPU有五大突破创新

NVIDIA发布的首款安培GPU有五大突破创新

第二十一个版本Ussuri发布，OpenStack有哪些新变化？

青云QingCloud要怎么做物联网？

新升级：青立方超融合易捷版将“极简”和“易用”发挥到了极致

超融合市场在继续增长，但尚不能取代传统外部存储

全闪存最大赢家为何成长如此飞快？

Amazon SageMaker给了我们一把开启智能时代的钥匙

英特尔SSD将全面转向144层QLC，第二代傲腾容量将翻倍

傲腾持久内存成就性能偏执狂SmartX

AWS持续领跑的十三个原因

GPU训练速度慢？不妨试试IPU

2021年情人节:21条不容错过的情话之最

少女怀春美梦：梦之所系，幸福永驻，与君共度

郑爽代孕弃养事件：生活不是演戏，生育是庄严的，不是感情的玩具

“达叔”吴孟达永远珍惜的是：和星仔一起同甘共苦的那段友情岁月

NVIDIA发布的首款安培GPU有五大突破创新

傲腾持久内存成就性能偏执狂SmartX

测试发现，高性能SSD并不能提升AI训练性能

戴尔科技集团合作伙伴峰会，黄陈宏博士解读时局看好未来

新华医院的HRP系统为何令三甲医院竞相学习？

AWS 技术峰会2020：关注技术方案在行业落地

英特尔架构日宣布第二代傲腾SSD有数百万IOPS

华科与华为校企合作再添硕果，新型存储技术创新中心启用

国产操作系统推荐多图速览之统信UOS桌面版：超预期

运维中台2.0是广通软件智能运维的核心基础和优势