耗时超四年 Intel Xe 独显即将登台亮相 你想了解的一切都在这

自从 2018 年英特尔发布打算重新进入独显市场,公布 Xe GPU 架构后,距今已经有三年时间,在上周的 Hotchips 33 技术峰会上,Intel 举办了名为 Intel 架构日的线上发布会,公布了 Intel Xe GPU 的品牌 Arc 以及预期的上市时间——2022 年第一季度。

这并非 Intel 历史上第一次做显卡,在 1989 年 Intel 就曾经发布了型号为 i860 的 RISC 处理器,该处理器的一个主要用途就是用于图形加速,可以视作为 Intel 最早的图形芯片。

到了 1998 年,这是三维图形芯片风起浪涌的年头,Intel 推出了著名的 i740 图形芯片,这是 Intel 历史上的第一枚三维加速芯片,取得了巨大的成功,而后还曾经出现过 i750,但是 i750 之后,Intel 开始把图形芯片以集显、核显等形式做到了芯片组和处理器中,放弃了独显市场。

当然,也不能说完全放弃,因为 Intel 在 2009 年的时候曾经公布了一个名为 Larrabee 的 GPU 计划,该计划试图用大量 P55C(Pentium II)做成一枚数十个内核的处理器,用通用计算的方式来作图形计算。这个项目最初的时候是牛逼哄哄,然而这个东西并未如 Intel 所愿,Intel 放弃了 Larrabee GPU 化的想法,将其直接做成了大家可能都听说过的 Xeon Phi,Xeon Phi 基本上只是作为通用加速器卖。

Xeon Phi 缺乏类似 GPU 那样的庞大主流市场支撑,无法降低成本,Intel 最终还是将这个产品线整个咔嚓掉了。

Xe GPU 项目就是在这个背景下发布的,此时市场已经证明了 NVIDIA 的 GPU 通用计算要远比其他处理器形式更适合人们的需求,GPU 上至超算下至笔记本电脑、游戏机、手机乃至挖矿赚小钱钱无处不在,增长势头时至今日依然相当强劲。

面对 NVIDIA 和 AMD 已经取得的成功,几乎从零开始的 Xe GPU 要想取得分一杯羹是相当困难的。为此,Intel 招募了大量人才,包括 AMD RTG 老大 Raja 等业界顶级精英,现在都已经在 Intel 图形部门麾下。

耗时超四年 Intel Xe 独显即将登台亮相 你想了解的一切都在这

在 Intel 架构日,Intel 公布了 Arc 的路线图,包括了四个代号,分别是 2022 年的 Alchemist (炼金术士)以及未来的 Battlemage (战斗法师,基于第二代 Xe)、Celestial (天神,基于第三代 Xe)、Druid(德鲁伊),Alchemist 作为 Intel 独显头炮在表现上无法取得 GPU 市场王位,但是有望为后续的 GPU 奠定稳固的基础。

耗时超四年 Intel Xe 独显即将登台亮相 你想了解的一切都在这

Alchemist:

在 Intel 的行销术语中,Xe-HPG 的处理单元被划分为几个级别,分别是最基础的 Xe-Core,然后是高一层的 Render Slice 以及更高层的 Graphics Engine。

如果对应 NVIDIA 这边的话,Xe-Core 相当于 NVIDAI 的 SM,Render Slice 相当于 NVIDIA 的 GPC,Graphics Engine 其实一整个 GPU 的概念了。

最高配置的 Alchemist 将会配有 8 个 Render Slice,每个 Render Slice 里有 8 个 Xe-Core,每个 Xe-Core 里有 16 个 Vector Engine,每个 Vector Engine 可以每个周期跑 8 个 FP32 FMA 操作,假设频率为 2.0 GHz 到 2.3 GHz,其理论单精度浮点性能就是 16.4 TFLOPS 到 18.8 TFLOPS:

8 (RS) * 4 (Xe-核心) *16 (VE) * 8 (FP32) * 2 (FMA) * 2.0–2.3 (GHz) = 16,384–18,841.6 GFLOPS

理论性能只能作为一个参考,因为 GPU 需要跑的任务不仅仅是纯通用计算,中间还涉及到纹理采样、光栅处理、抗锯齿以及访存等等,按照 Intel 的说法,顶配的炼金术士性能可以和 NVIDIA 的 RTX 3070 相当,对于从零开始的 GPU 来说,这是一个非常可以接受的水平了。

耗时超四年 Intel Xe 独显即将登台亮相 你想了解的一切都在这

Intel 的每个 Xe-Core 里都集成了名为 Matrix Engine 的人工智能加速单元,它相当于 NVIDIA 这边的 Tensor Core,能够对人工智能学习涉及到的矩阵计算提供加速。为了充分利用这些资源,Intel 研发出了名为 XeSS XMX 的超分辨率技术,该技术从目前提供的效果来看,非常接近于 NVIDIA 的 DLSS,由于引入了时间域采用,理论上也要比 AMD 的 FSR 更出色。

XeSS 还可以在具备 DP4a 指令的其他 GPU 上执行,但是具备 DP4a 的 GPU 都是近两年才出现,所以不要指望 XeSS 的 DP4a 版本可以像 FSR 那样回溯到更老旧的 GPU 上执行。

考虑到现实的成本因素,Alchemist 很可能会采用 GDDR6 内存,这意味着它的内存总线将具备 16Gbps 的速率。Intel 并未公布 Alchemist 的具体内存总线位宽,依据目前的推测,它可能具备 256-bit 内存总线,因此总内存带宽可能会有 512GB/s。

人们根据 Intel 架构日视频里的 Alchemist 晶圆,分析出其芯片大小约为 396mm^2,非常接近于 NVIDAI 的 GA104(393mm^2),考虑到 Intel 这次为 Alchemist 采用的是 TSMC 的 N6 制程在密度上要比 NVIDIA GA104 三星 8nm 制程更高,因此 Alchemist 的等效芯片大小其实要比 GA104 更大一些。

对于矿工们来说,由于较强的浮点性能以及较大的内存带宽,Alchemist 在挖矿方面的潜能可能比较值得期待,但是它的发布时间是在明年第一季度,届时的以太坊可能已经转向了 POS 或者说 ETH 2.0,不再需要显卡挖矿了,要挖也只能挖一些目前的寨币,收益率如何可能是一个很大的问号,特别是明年可能联储局会转向通缩政策,市场的资金会显著减少,币价回落是比较大概率的事情。

以上就是关于明年 Alchemist 目前已经公布的资料总结,剩下的疑问其实还是不少,例如 Alchemist 的光线追踪性能、显卡的散热设计,当然最重要的还是供货情况和价格,都需要明年才能知道了。

展开阅读全文

页面更新:2024-03-09

标签:三星   浪涌   浮点   人工智能   总线   架构   处理器   显卡   芯片   图形   内存   性能   明年   理论   数码   市场

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top