GTC2021,黄仁勋放了哪些大招?

显卡无疑已经是当下IT圈子最热门的话题,但对于NVIDIA而言,关于图形、视觉乃至大规模并行运算的征程,已经开启了新的几点。就在今天,NVIDIA GTC 2021正式拉开序幕,NVIDIA首席执行官黄仁勋在自家厨房展开了新一轮的主题演讲。


GTC2021,黄仁勋放了哪些大招?


从画面中可以看出,疫情的不确定性没有阻止老黄造型朝着朋克方向发展,而NVIDIA的技术延伸已经开始让全球技术应用变得赛博朋克起来。在这场95分钟的演讲中,黄仁勋一口气涵盖了AI、汽车、机器人、5G、实时图形、协作和数据中心等领域,也涵盖了CPU、DPU和GPU。


是的,我们所熟知的RTX系列显卡仅仅是NVIDIA阵营的冰山一脚,开始横向扩张的NVIDIA也已经开启了全领域解决方案覆盖的方向,并逐渐渗透到我们日常生活中的每一个角落。


GTC2021,黄仁勋放了哪些大招?


从游戏生态扩展到生产力


GPU作为传统项目被自然而然摆到了演讲的开头,在GeForce RTX的带动下,实时光线追踪技术的普及变得更为宽泛。特别是第二代RT Core与第三代Tensor Core结合,将原本遥不可及的光线追踪圣杯变得近在咫尺。


在演示画面中,笔者还意外的发现了网易游戏新作《那落迦:刀锋相向》以及《黑暗神话:悟空》的演示场景。这意味着新的游戏技术已经开始渗透到更多游戏的创作阶段中。


GTC2021,黄仁勋放了哪些大招?

GTC2021,黄仁勋放了哪些大招?


重点是原本在游戏付诸实践的技术,与诸如《我的世界》这种开放游戏世界的元宇宙概念相结合,针对专业领域的云原生平台NVIDIA Omniverse为此诞生。


你可以这么理解,NVIDIA Omniverse是一个基于专业技术软件的《我的世界RTX》和《堡垒之夜》。在虚拟世界中,全球各地的工程师、科学家可以通过不同的入口汇聚在一起,在多个GPU的共同协助下,实现高物理精度,并充分运用RTX实时光线追踪、DLSS技术,利用NVIDIA MDL模拟材料、NVIDIA PhysX模拟物理,NVIDIA AI完成人工智能推算的线上平台。


GTC2021,黄仁勋放了哪些大招?


如同尼尔·斯蒂芬森在1990年代早期的小说《雪崩》中所描述的科幻虚拟空间那样,疫情虽然在物理上隔阂了大家同一空间内办公的可能性。但是Omniverse通过创建一套全新的虚拟世界将全球各地员工重新汇聚到了一起。


NVIDIA Omniverse最厉害的地方在于有着很强的普适性,无论是建筑、娱乐、游戏、广告行业,NVIDIA Omniverse都已经有所涉及。


GTC2021,黄仁勋放了哪些大招?

GTC2021,黄仁勋放了哪些大招?


为此,黄仁勋还特意连线了宝马董事会董事Milan Nedeljković共同展示一套基于现实的宝马高自动化工厂虚拟构建场景。宝马工程师将在全世界各个角落,共同涉及和配套自动化工厂设施,完成工厂规划,并最终形成方案付诸实践。


Nedeljković表示:“这些创新将帮助我们缩短规划时间、提高灵活性和精度,最终使规划效率提高30%。


GTC2021,黄仁勋放了哪些大招?


高性能AI CPU Grace参上


主题演讲中最具话题性的应该要算NVIDIA推出的全新CPU Grace,这款CPU的命名来自于计算机编程先驱Grace Hopper名字,主要面向大型数据密集型HPC和AI应用。虽然正式面世被设定在了2023年,但是并不阻止老黄兴奋的心情。


这是一款基于ARM Neoverse内核的迭代版本,并且也将成为NVIDIA扩充AI服务器市场的重要砝码。从定位上来看,NVIDIA Grace目的在于填补NVIDIA AI服务器中的CPU空白,在表现上更适合匹配GPU的工作负载,确保GPU不再受到GPU的性能约束。


GTC2021,黄仁勋放了哪些大招?


目前NVIDIA服务器主要使用AMD EPYC处理器,缺乏NVIDIA所需要的高速I/O深度学习油画,而传统的PCIe通道已经成为GPU之间沟通的瓶颈,已经付诸实践的NVLink已经能够做到不通过CPU和内存,加快GPU之间的沟通进度。


因此一种能够支持高性能、高带宽并且能够协同GPU工作的CPU就此诞生。在每一款NVIDIA GPU板卡上,都将配备一个单独的Grace CPU,这意味CPU数量将随着GPU的增加而增加,CPU更像是充当协处理的作用。这与时下流行的CPU+iGPU融合方案完全相反。


如果进展顺利,NVIDIA将在2023年升级到NVLink 4,SoC与GPU之间可以获得至少900GB/s带宽,其中Grace CPU可以提供至少600GB/s带宽,并允许GPU和CPU拥有访问缓存的一致性。这意味着在Grace CPU的设计中,GPU还能访问通过CPU控制的LPDDR5x内存,获得更高的效能,并支持ECC纠错技术。


GTC2021,黄仁勋放了哪些大招?


CPU性能显然不是Grace的重点,黄仁勋只简单提到Grace的SPECrate2017_int_base吞吐量基准测试超过300分,可以与AMD第二代EPYC 64核CPU媲美,在新的CPU、GPU结构优化下,64组Grace与使用NVLink的A100搭配,可以将原本需要训练一个月的模型缩短到三天。


相比以往的ARM项目,Grace的定位其实相对保守,它可以看成在GPU为主导的体系下运作,而非像Tegra、Xavier那般延伸到全新领域,并且有着更为明确的实际用途以及效果。


有意思的是,2023年的发布节点并非完全依照工程师的研发季度推算而来。事实上Grace已经成为瑞士国家超级计算中心CSCS和美国洛斯·阿拉莫斯国家试验室首批用户,在Grace正式交付超算之后,NVIDIA才有足够的产能应付更多的服务器订单。


其中瑞士国家超级计算中心的最新超算称为Alps,将用于替代目前由Xeon和NVIDIA P100集群组成的Piz Daint,根据估算,新超算将提供超过20 ExaFLOPS的AI性能,这也将Alps推向了人工智能超算中心宝座的位置。


GTC2021,黄仁勋放了哪些大招?


值得注意的是,Alps还将作为一套通用系统,应付包括天气、气候在内的传统研究,这也将考验着Grace与A100搭配下的传统计算能力,给NVIDIA开发下一代通用计算CPU留足经验。


GTC2021,黄仁勋放了哪些大招?


BlueField-3发布


为了获得更好的数据中心软件定义网络、存储、网络安全加速,NVIDIA还推出了首款为AI加速度BlueField-3 DPU。DPU针对多用户、云原生环境优化,提供数据中心软件定义和硬件加速的网络、存储、安全、管理内容。


按照NVIDIA说法,一个BlueField-3 DPU实现的数据中心服务能够实现300个CPU才能完成任务,并且可以从业务应用中将数据中心的基础设施服务卸载和隔离出来,实现了由传统基础设施到现代基于“零信任”环境的转型,可对数据中心的每个用户进行身份认证,保障了企业从云到核心数据中心,再到边缘的安全性,同时在效率和性能上有了更大的提升。


相比上一代,BlueField-3有10倍加速计算能力、16个Arm A78 CPU核,和4倍的加密速度。有意思的是,BlueField-3也是首款支持PCIe 5.0并提供数据中心时间同步加速的DPU。


GTC2021,黄仁勋放了哪些大招?


与此同时,与BlueField-3配套的NVIDIA Morpheus AI云原生网络安全平台也同步推出,以实现网络可视化、网络威胁的检测与响应、以及监控、遥测和代理服务。这是一套深度学习来识别、捕捉和应对从前无法识别的威胁和异常情况,包括未加密敏感数据的泄露、网络钓鱼攻击和恶意软件。


在Morpheus与BlueField DPU配合下,企业可以做到无需复制数据,以线速分析每个数据包。避免传统AI工具只能采样5%左右的网络数据推测威胁检测的尴尬。


此外,NVIDIA还开发了NVIDIA DOCA SDK 1.0作为软件开发平台,用于推进BlueField DPU的开发工作。


目前为止,已经有戴尔、浪潮、联想和超微将BlueField DPU纳入到他们的服务器系统中,包括百度、京东和UCloud在内的服务商也已经使用BlueField DPU加速业务运行。可以看到BlueField的生态系统正在不断扩大。


GTC2021,黄仁勋放了哪些大招?


高性能平台多管齐下


追求尖端性能产品一直是NVIDIA的风格,在演讲中黄仁勋还一口气发布了多款产品,包括NVIDIA DGX Station、NVIDIA DGX SuperPod、NVIDIA EGX和Aerial A100。


其中NVIDIA DGX Station定位便携式AI数据中心,NVIDIA DGX Station 320G能够提供320GB HBM2e与4个NVIDIA A100 GPU,功耗1500W,通过家用电源就能在家实现AI性能加速。


更猛的NVIDIA DGX SuperPod则提供全新80GB NVIDIA A100,将其HBM2e内存提升至90TB,支持NVIDIA BlueField-2,同时还配套NVIDIA Base Command DGX管理和编排工具。


GTC2021,黄仁勋放了哪些大招?


NVIDIA EGX平台则能够通过原有基础设施(从数据中心到边缘)加速并保护现有的及新式的应用程序。目前NVIDIA EGX平台上运行的NVIDIA AI Enterprise软件套件已经获得全球最广泛的计算虚拟化平台VMware vSphere 7认证。EXG平台将配备NVIDIA A30 GPU和NVIDIA A10 GPU实现AI、虚拟工作站,混合计算和图形工作负载等诸多需求。


GTC2021,黄仁勋放了哪些大招?


Aerial A100则是NVIDIA的AI-on-5G计算平台,通过5G与AI结合,使用BlueField-2 A100作为硬件制程,并配以NVIDIA Aerial开发套件。


更有意思的是,NVIDIA还推出了一套基于DGX的cuQuantum开发工具组,用于加速量子计算研发进度,通过点怒模拟量子计算特性,在9.3分钟内实现谷歌Sycamore原本需要数天才能完成深度取样。黄仁勋预计在2035年到2040年期间,量子计算领域将出现重大技术突破,NVIDIA cuQuantum目的在于推进量子计算的研发进程。


GTC2021,黄仁勋放了哪些大招?


此外,NVIDIA还发布了一系列AI软件发挥NVIDIA的硬件性能,例如Transformers的训练架构NVIDIA Megatron,和变形金刚Transformers一样,Megatron源自其中的角色威震天,新的架构能够支持Transformers生成文档摘要、将电子邮件中的短语补充完整、对测验进行评分、生成体育赛事现场评论、甚至生成代码。


GTC2021,黄仁勋放了哪些大招?


继续给自动驾驶加速


是的,提到变形金刚和威震天,还应该有汽车人。经过多年发展,NVIDIA已经开始为为价值10万亿美元的交通运输行业构建模块化的端到端解决方案。黄仁勋表示,NVIDIA将在2022年正式投产NVIDIA DRIVE Orin,新一代沃尔沃XC90将会继续引入NVIDIA DRIVE Orin作为汽车的电脑中枢,为汽车保驾护航。


GTC2021,黄仁勋放了哪些大招?


与此同时,NVIDIA还推出了汽车数据中心NVIDIA DRIVE Atlan,能够实现每秒1000万亿次运算次数。第八代NVIDIA Hyperion汽车平台提供传感器、自动驾驶、3D地面真实数据记录仪、网络等必要性能。


同样,前面提到的Omniverse也将在汽车领域研发中发挥重要的作用。


GTC2021,黄仁勋放了哪些大招?


写在最后:全面开花进行时


黄仁勋在结尾强调,NVIDIA已经变成了一家同时掌握GPU、CPU、DPU三种芯片的公司,并且依靠NVIDIA AI和NVIDIA Omniverse晋升软件平台公司的行列,同时掌握Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE大量平台的NVIDIA还是一家AI公司。不仅如此,NVIDIA还不断向外扩展,例如用于研究的DGX,用于云端的HGX,用于5G的EGX和用于机器人的AGX,不断将解决方案扩展到各个领域。


GTC2021,黄仁勋放了哪些大招?


如果说迈向全领域芯片解决方案是芯片厂商的终极目标,那么NVIDIA已经向这个目标又跨出了一大步。是的,除了游戏玩家,各行各业的工程师、内容创作者,科学家,都有机会在NVIDIA的产品阵营体系中找到一套属于自己的解决方案,基于GPU衍生出的产品,已经在更广的领域全面开花。


GTC2021,黄仁勋放了哪些大招?

展开阅读全文

页面更新:2024-03-03

标签:宝马   付诸实践   量子   数据中心   性能   解决方案   工程师   传统   领域   数码   汽车   平台   技术   软件   游戏   网络

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top