根据《电子时报》等媒体报道,有服务器供应商证实,GB300将继续沿用GB200的比安卡(Bianca)设计,放弃了原计划的重构方案,而这一重构方案原本有望为零部件制造商带来更多业务。
《电子时报》称英伟达GB200采用的是“比安卡(Bianca)架构”,但在英伟达 GB200 的相关资料中,“Bianca” 通常指的是 GB200 所采用的一种主板设计,而非一种独立的架构。
GB200 采用的是 Blackwell 架构,由两个 B200 Blackwell GPU 和一个基于 Arm 的 Grace CPU 组成。Bianca 主板是一种定制化设计,直接将 2 个 B200 GPU 和 1 个 Grace CPU 集成在同一 PCB 上。这种设计提供了整个 Bianca 板,包括 Blackwell GPU、Grace CPU、512GB LPDDR5X、VRM(电压调节模块)等都集成在一块 PCB 上,同时还提供交换托盘和铜背板。
例如,英伟达的 GB200 NVL72 机架包含 18 个计算托盘和 9 个 NVSwitch 托盘(18 个 NVSwitch ASIC),每个托盘有两块 Bianca 板,每块板上有一个 Grace CPU 和两个 Blackwell GPU。
高集成度芯片组合:由两个 B200 Blackwell GPU 和一个基于 Arm 的 Grace CPU 组成,将强大的图形处理能力与高效的中央处理能力相结合,集成 2080 亿个晶体管,适用于处理复杂的人工智能任务,如大规模语言模型的训练和推理。
先进的制程工艺:采用台积电的 4 纳米工艺制程,有助于在提高性能的同时降低功耗,提升芯片的集成度和运行效率。
高速互连技术:配备第五代 NVLink,每个 GPU 提供 1.8TB/s 双向吞吐量,支持多达 576 个 GPU 之间的无缝高速通信,大大提高了多 GPU 系统中数据传输的速度和效率,减少通信延迟。采用 NVLink - C2C 互连技术,将 2 个高性能 NVIDIA Blackwell Tensor Core GPU 与 1 个 NVIDIA Grace CPU 连接,实现高效的计算协同。
大容量高带宽内存:配备 192GB 的 HBM3e 内存,具有超过 8TB/s 的峰值内存带宽,为处理大规模人工智能模型和复杂计算提供了充足的内存资源,能够快速读取和存储数据,满足高负载计算需求。
强大的 AI 计算能力:基于 Blackwell 架构,AI 性能可达每秒 20 千万亿次浮点运算,推理大语言模型性能比 H100 提升 30 倍,在参数为 1750 亿的 GPT - 3 LLM 基准测试中,性能是 H100 的 7 倍,训练速度是 H100 的 4 倍。
独特的主板设计:GB200 主板采用 MGX 模式,相比之前的 HGX 模式有了升级。其 Compute Tray 由纬创与工业富联共同生产,Switch tray 由工业富联制造。在不同的机架形式中,如 NVL72 机架包含 18 个计算托盘和 9 个 NVSwitch 托盘,每个计算托盘有两块 Bianca 板,每块板上有一个 Grace CPU 和两个 Blackwell GPU。
高效的冷却方案:采用冷板式液冷解决方案,能够有效解决高计算密度下的散热问题,提高系统的稳定性和可靠性,同时减少占地面积,降低数据中心的碳足迹和能源消耗。
丰富的功能引擎:具有第二代 Transformer 引擎,结合 Blackwell Tensor Core 技术和 TensorRT - LLM 及 NeMo Megatron 框架中的先进动态范围管理算法,通过新的 4 位浮点 AI 支持双倍的计算和模型大小推理能力。还拥有专用解压缩引擎,支持最新格式,可加快数据库查询,为数据分析和数据科学提供高性能支持。此外,Blackwell 架构支持的 GPU 包含一个专用的 RAS 引擎,用于实现可靠性、可用性和服务性,并增加了芯片级功能,利用基于 AI 的预防性维护进行诊断和预测可靠性问题。
引入GPU插槽:英伟达计划为即将推出的第二代Blackwell B300系列处理器引入插槽设计,替代传统的直接表面贴装(SMT)。此举旨在改善低生产良率问题(目前Wistron计算板的良率为80%,而UBB良率超过90%)并提高维修性。初期插槽由FIT供应,未来可能会引入Lotes作为第二供应商。
增设冷板模块:由于GPU插槽的采用,新冷板模块可能会为每个GPU/CPU单独设计,并使用新型体积更小的NVQD取代GB200中的UQD(快换接头)设计。主要供应商包括CoolerMaster和AVC集团,Fositek、FII和Lotes也可能受益。
更高功率的电源模块:独立电源架有望被引入,以满足更高的可靠性和功率需求。GB300的电源单元将支持10kW和12kW,适用于60kW和72kW的电源架,具体取决于机架兼容性、生产验证和可靠性测试。大摩预计,硬件规格更新预计将于今年二季度初完成,顺利通过测试后将在四季度批量出货。
除了硬件更新,报告还预计在GB300系列的生产过程中,ODM(原始设计制造商)的价值将有所提升。报告称,与GB200相比,英伟达将在GB300的机械组件设计中减少参与度,这将赋予ODM更多设计空间。ODM可以为超大规模客户(hyperscalers)提供定制化设计服务,潜在地提升其利润率。
原来的GB300相对GB200的变化主要是
1. GPU 和 CPU合封,散热要求更大,芯片内部散热门槛要求更高,还有热界面Tim要求更高;
2. 采用socket方式(插槽方式),而不是以前的SMT(贴片焊接)方式,PCB的难度很大。有产业链看到这个PCB惊呼 是一个高难度的组合(因为除了socket 还有其他的高速,高密度钻孔等要求)。高端PCB本来供不应求,未来供给缺口会进一步加剧。
3. 给予了ODM更大的自由度。ODM议价权和裁量权更大。
现在看来,GB300继续沿用GB200的比安卡(Bianca)设计,就是放弃了原计划引入的插槽方式,仍然直接将 2 个 B200 GPU 和 1 个 Grace CPU 集成在同一 PCB 上。这显然是能降低PCB板的生产难度,加快GB300上市速度。摩根士丹利分析师Sharon Shih、Howard Kao等原本预计GB300将于今年四季度开始出货,现在看有可能会提前。
更新时间:2025-05-01
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号