陈根:从GPU到DPU,计算体系正变革

文/陈根

很长一段时间以来,算力的天下都由中央处理器(CPU)和图形处理单元(GPU)平分,也是因为CPU和GPU为庞大的新超大规模数据中心提供了动力,才使得计算得以摆脱PC和服务器的繁琐局限。

然而,近几年,随着系统中的CPU承受越来越多的网络和存储工作负载,已有的通用CPU和GPU开始不能完全满足快速变化的应用需求,而性能更强大,更加专用,更加异构的数据处理单元(DPU)登上了历史的舞台

当前,DPU已成为以数据为中心的加速计算模型的三大支柱之一。其改变计算体系的端倪也正在浮现。

陈根:从GPU到DPU,计算体系正变革

从二分天下到三分天下

自1950年代以来,中央处理器(CPU)就一直是每台计算机或智能设备的核心,是大多数计算机中唯一的可编程元件。并且,CPU诞生后,工程师也一直没放弃让CPU以消耗最少的能源实现最快的计算速度的努力。即便如此,人们还是发现CPU做图形计算太慢。在这样的背景下,图形处理单元(GPU)应运而生

英伟达提出了GPU的概念,将GPU提升到了一个单独的计算单元的地位。GPU是在缓冲区中快速操作和修改内存的专用电路,因为可以加速图片的创建和渲染,所以得以在嵌入式系统、移动设备、个人电脑以及工作站等设备上广泛应用。1990年代以来,GPU则逐渐成为了计算的中心。

事实上,最初的GPU还只是用来做功能强大的实时图形处理。后来,凭借其优秀的并行处理能力,GPU已经成为各种加速计算任务的理想选择。随着机器学习和大数据的发展,很多公司都会使用GPU加速训练任务的执行,这也是今天数据中心中比较常见的用例。

相较于CPU,大多数的CPU不仅期望在尽可能短的时间内更快地完成任务以降低系统的延迟,还需要在不同任务之间快速切换保证实时性。正是因为这样的需求,CPU往往都会串行地执行任务。而GPU的设计则与CPU完全不同,它期望提高系统的吞吐量,在同一时间竭尽全力处理更多的任务。

设计理念上的差异也最终反映到了CPU和GPU的核心数量上,GPU往往具有更多的核心数量。当然,CPU和GPU的差异也很好地形成了互补,其组合搭配在过去的几十年里,也为庞大的新超大规模数据中心提供了的动力,使得计算得以摆脱PC和服务器的繁琐局限。

然而,近几年,随着系统中的CPU承受越来越多的网络和存储工作负载,已有的通用CPU和GPU开始不能完全满足快速变化的应用需求。据IDC统计,近10年来全球算力增长明显滞后于数据的增长。每3.5个月全球算力的需求就会翻一倍,远远超过了当前算力的增长速度

在此驱动下,全球计算、存储和网络基础设施也在发生根本转变,一些复杂的工作负载,在通用的CPU上不能很好的处理。或者说,以CPU为中心的数据中心架构已经不能满足需求,以数据为中心才能更好满足市场和应用需求

英伟达网络事业部亚太区市场开发高级总监宋庆春此前就表示:“以前计算规模和数据量没那么大,冯诺依曼架构很好地解决了提高计算性能的问题。随着数据量越来越大,以及AI技术的发展,传统的计算模型会造成网络拥塞,继续提升数据中心的性能面临挑战。”

数据处理单元(DPU)的出现或将解救这一困境,作为最新发展起来的专用处理器的一个大类,DPU为高带宽、低延迟、数据密集的计算场景提供计算引擎。当前,DPU已成为以数据为中心的加速计算模型的三大支柱之一,其还将成为CPU的卸载引擎,释放CPU算力到上层。

陈根:从GPU到DPU,计算体系正变革

DPU蔚然成风

按照技术出现的时间顺序和特点,DPU的发展则可以分为三个阶段

展开阅读全文

页面更新:2024-06-03

标签:英伟   都会   中央处理器   数据处理   负载   数据中心   单元   模型   性能   体系   需求   快速   数据   数码   系统   中心   网络

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top