英伟达H100霸榜权威AI性能测试 11分钟搞定基于GPT-3的大模型训练

财联社6月28日讯（编辑史正丞）当地时间周二，机器学习及人工智能领域开放产业联盟MLCommons披露两项MLPerf基准评测的最新数据，其中英伟达H100芯片组在人工智能算力表现的测试中，刷新了所有组别的纪录，也是唯一一个能够跑完所有测试的硬件平台。

（来源：英伟达、MLCommons）

MLPerf是由学术界、实验室和产业组成的人工智能领袖联盟，是目前国际公认的权威AI性能评测基准。Training v3.0包含8种不同的负载，包括视觉（影像分类、生物医学影像分割、两种负载的物体侦测）、语言（语音识别、大语言模型、自然语言处理）和推荐系统。简单来说，就是由不同的设备供应商提交完成基准任务所需要的时间。

（Training v3.0训练基准，来源：MLCommons）

在投资者比较关注的“大语言模型”训练测试中，英伟达和GPU云算力平台CoreWeave提交的数据为这项测试设定了残酷的业界标准。在896个英特尔至强8462Y+处理器和3584个英伟达H100芯片的齐心协力下，仅仅花了10.94分钟就完成了基于GPT-3的大语言模型训练任务。

除了英伟达外，只有英特尔的产品组合在这个项目上获得评测数据。由96个至强8380处理器和96个Habana Gaudi2 AI芯片构建的系统中，完成同样测试的时间为311.94分钟。横向对比，使用768个H100芯片的平台跑完这个测试也只需要45.6分钟。

（芯片越多数据越好看，来源：英伟达）

对于这个结果，英特尔也表示仍有上升空间。理论上只要堆更多的芯片，运算的结果自然会更快。英特尔AI产品高级主管Jordan Plawner对媒体表示，接下来Habana的运算结果将会呈现1.5倍-2倍的提升。Plawner拒绝透露Habana Gaudi2的具体售价，仅表示业界需要第二家厂商提供AI训练芯片，而MLPerf的数据显示英特尔有能力填补这个需求。

而在中国投资者更熟悉的BERT-Large模型训练中，英伟达和CoreWeave将数据刷到了极端的0.13分钟，在64卡的情况下，测试数据也达到了0.89分钟。BERT模型中的Transformer结构正是目前主流大模型的基础架构。

展开阅读全文

页面更新：2024-02-22

标签：英伟模型英特尔人工智能基准芯片来源语言权威测试数据

1 2 3 4 5

英伟达H100霸榜权威AI性能测试 11分钟搞定基于GPT-3的大模型训练

（来源：英伟达、MLCommons）

（Training v3.0训练基准，来源：MLCommons）

（芯片越多数据越好看，来源：英伟达）

红魔8S Pro首发24GB大内存，一加、真我也有，大内存真有必要吗？

华为孟晚舟：5G正在跨越量变到质变的拐点

直击汶川山洪泥石流现场：板子沟与岷江河道交汇处已基本畅通

中国最长盾构高速公路隧道首线贯通

“火山方舟”MaaS平台亮相，首创大模型安全互信计算

「万能Python」标准模块sys

共建港珠澳大桥经贸新通道在珠海全面启动

赚钱？太容易了吧！

跨国公司高管看好中国经济潜力和发展前景

九大光伏组件龙头对矩形硅片尺寸达成统一

医药情报-步长制药拟1元转让子公司90%股权，国药现代董事长辞职

长安加速新能源车攻势，Alpine计划2030年营收80亿欧元 - 第一财经汽车日评

（财经·行情）纽约金价28日下跌

深化细化十大产业链做优做强向高端迈进李亚主持召开先进铝基材料产业链工作专班会议

广州提高二孩及以上家庭首套住房公积金贷款额度

“火山方舟”MaaS平台亮相，首创大模型安全互信计算

2023年十大新兴技术出炉　生成式人工智能在列

山西5月经济数据出炉

用的AMD处理器换下来英特尔的客户质疑博思电脑虚假换

北京发布人工智能大模型应用案例

世界互联网大会数字文明尼山对话｜互联网大咖畅谈人工智

电科芯片：目前暂未布局人工智能芯片，发展布局暂未涉及该

科大讯飞：星火大模型的持续迭代升级基础是自主可控的算

现在的编程语言这么繁杂，难道你就不想知道它最早是如何

王慧文病休离岗，大模型创业到底有多卷