英伟达中国特供版AI显卡H20,性能只有原本1半不到

近日,英伟达却宣布了一项令人惊讶的决定:为中国市场专门推出了一款低性能的AI芯片,名为H20。这是英伟达为了遵守美国的新规定,限制向中国出口高端芯片而做出的妥协。那么H20芯片的性能如何?

H20芯片是基于Ampere架构的一款AI芯片,它拥有4096个CUDA核心和256个张量核心,能够提供0.3 TFLOPS的FP64精度算力和25 TFLOPS的FP16/BF16精度算力 。这意味着它能够在每秒钟内进行0.3万亿次的双精度浮点数运算或者25万亿次的半精度/ Bfloat16浮点数运算。H20芯片的功耗为400W,也就是说它需要消耗400瓦的电力才能正常工作。


与之相比,H100芯片同样基于Ampere架构,它拥有8192个CUDA核心和512个张量核心,能够提供10.4 TFLOPS的FP64精度算力和332.8 TFLOPS的FP16/BF16精度算力 。这意味着它能够在每秒钟内进行10.4万亿次的双精度浮点数运算或者332.8万亿次的半精度/ Bfloat16浮点数运算。H100芯片的功耗为700W,也就是说它需要消耗700瓦的电力才能正常工作。

从这些数据可以看出,H20芯片的FP64精度算力只有H100芯片的2.9%,而FP16/BF16精度算力只有H100芯片的7.5%。换句话说,H20芯片的效能降低了92.1%到97.1%不等。这是一个非常大的差距,也是一个非常大的损失。


英伟达表示,H20芯片并不是简单地将原本的H100芯片进行阉割,而是采用了新的架构和技术,提供了更多的功能和优化。例如,H20芯片支持多实例GPU(MIG)技术,可以将一个GPU分割成多个独立的GPU实例,从而提高资源的利用率和灵活性。H20芯片还支持第三代张量核心(TC3)技术,可以提高张量运算的效率和稳定性。H20芯片还支持第二代稀疏计算(SC2)技术,可以利用数据的稀疏性,减少计算量和内存占用。H20芯片还支持第三代结构化稀疏(SS3)技术,可以提高稀疏计算的精度和兼容性。H20芯片还支持第二代NVLink技术,可以提高GPU之间的通信速度和带宽。

英伟达还表示,H20芯片是为了满足中国市场的不同需求而设计的,它们可以提供更低的功耗和更高的性价比,适合用于云计算、数据中心、边缘计算等场景。英伟达还表示,H20芯片将于2023年12月上市,届时将会有更多的细节和评测公布。


就挺难评的,不过还是需要等实际硬件出炉后再看,不知道有没有机会杠上华为的AI芯片呢?

展开阅读全文

页面更新:2024-05-16

标签:英伟   张量   稀疏   中国市场   功耗   中国   精度   架构   显卡   芯片   性能   核心   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top