硬件光追进入新阶段,Imagination推出DXT系列GPU IP

作为GPU皇冠上的明珠,实时光线追踪技术近年来得到了迅速发展。


然而并不是所有的光线追踪体验都是一样的,正如GPU IP供应商Imagination所说,光线追踪技术可以细分为很多层级,其中第一级光线追踪技术通过软件实现,CPU占用资源较高。第二级光线追踪技术是利用硬件处理光和或者三角形碰撞,从而节省了CPU资源,目前典型的桌面显卡都是采用了这项技术。第三级光线追踪技术开始,就需要支持BVH回溯。BVH是bounding volume hierarchy,这是一种用来管理3D场景中物体的方法。这部分是目前渲染器中最困难的部分,但是可以是渲染器更加高效。第四级光线追踪技术除了光和自动测试的回溯之外,还需要相同光线上的光数统一计算,用统一的指令运行。而第五级技术则需要支持BVH builder,目前作为公司的储备技术。


高级光线追踪技术需要更新的硬件

如上图所述,Imagination认为,从CXT GPU IP开始,光线追踪技术就已经进入到第四级。


日前,Imagination宣布推出IMG DXT系列GPU,将移动设备的光追体验带入到了新阶段。尤其是如今,手机性能越来越高,在手机上玩3A大作已经不再是一种幻象。由此,玩家越来越需要沉浸且流畅的体验、真实的画面、以及更小的发热及更长的待机功耗,所有这些都对GPU有了全新的要求。


总体而言,这款GPU可以从节省面积的0.5 RAC(光线加速集群)配置扩展到高性能的4 RAC设计,涵盖从混合实现方案中的简单阴影到3A大作中的高级光追画面等各类应用。


“通过DXT,可以让光线追踪技术可以尽快铺开,哪怕只有0.5个RAC,也可以快速覆盖市场,从而让真正的内容开发者愿意去进行光线追踪相关开发。”Imagination首席营销官David Harold说道。由于如今手机的光线追踪大部分还是软件实现的,因此无论是资源占用还是功耗,都还不能商用化。


同时,为了快速实现光追技术,Imagination同行业、客户以及合作伙伴,包括手机厂商和游戏厂商共同合作,通过推出PVR2等工具,简单部署光线追踪技术。


DXT详解


旗舰产品DXT-72-2304能够提供超高端移动设备所需的性能,具有72 GTexels/s和2.5 TFLOP FP32算力。与上一代产品相比,其最大单核性能提升了50%。DXT核的单位面积性能密度比IMG CXT GPU高出20%,同时大幅降低了功耗。


如图所示,在可配置内核上,最大的单核配置从CXT-64-2048升级到DXT-96-3072,单核性能提高了50%。并且拥有可选择的光线追踪RAC。


DXT目前包括三个系列。分别面向主流、高端以及旗舰型,提供不同算力、像素填充率以及光线追踪RAC等。

如图所示,不同公司的光线追踪技术有着明显差别,那么为什么Imagination的DXT系列可以一枝独秀?官方透露了几个黑科技。


支持Vulkan的片段着色率(FSR)技术


片段着色率(Fragment Shading Rate,FSR)(在DirectX中也称为可变着色率VRS)是一种可以提高图像表现并降低功耗的技术。FSR允许共享着色器程序的执行结果跨多个片段。因此,不是1:1执行着色器程序,这意味着一个着色器可以覆盖更多像素的区域,从而实现了更高的性能、更低的带宽和更低的功耗。


Imagination表示,开发者可以控制FSR的使用力度,最极端的情况下甚至可以对一个4x4的片段区域只执行一次着色器代码,这意味着只需1/16的资源,从而使工作负载减少近94%。


FSR可以在用户不太注意的地方复用,从而节约资源。另外,FSR功能也适用于光线跟踪。因为着色器调用需要发射的光线更少,因此提交的光线更少并且结果在较大的像素区域上被重新使用。

如图所示,我们可以看到在周边区域,可以运用更多的4X4单元统一着色,而在需要光线追踪的地方,应选择更细致的着色。而缩减光线数量,基本在图像表现上看不出差异。


2D双速率纹理处理


许多先进的游戏依靠大量纹理取样实现高级过滤效果。IMG DXT GPU的纹理处理单元(TPU)内置一个已获得专利的创新特殊模式,能够为这些后处理效果创建一条“快速通道”,在使双线性滤波性能几乎翻倍的同时,最大程度地减少面积的增加并降低整体功耗。该GPU不但可以加速诸如游戏后处理和计算图像学应用中的滤镜效果;更高的吞吐量也有助于实现更快、更低功耗的降噪算法,提高光追画面的质量。


数据显示,许多游戏花费大量资源执行后处理算法,以实现景深、光华和模糊等效果。最在这些后处理过程中,纹理采样的重过滤效果在运算逻辑单元(ALU)执行,因此受到TPU瓶颈。解决这一问题的简单方法是增加TPU单元的数量与USC/ALU的比例。然而,这不是好的策略。首先,在常规渲染过程中,ALU与TPU的比率已经是最佳的了。同时,带宽也无法足够满足更多TPU的吞吐率需求。而Imagination的技术可在保持整体平衡的同时,将执行效率提升一倍。


RISC-V技术支持


Imagination持续投入RISC-V的研发,将其成果应用于其产品线中。DXT中使用的遵循RISC-V协议的固件处理器,可以实现40%的固件性能改善,并且该固件已经在其汽车GPU BXS系列产品中得到验证。IMG DXT还受益于RISC-V的电源域特征,把重点放在降低空闲功率关闭不使用的GPU部分和优化随机工作负载性能上。


Pipeline Data Master技术


Imagination的PowerVR GPU从一开始就由固件处理器驱动。固件处理器负责工作负载的高级调度和优先级,允许并发处理不同类型的作业PowerVR GPU具有每个作业类型的数据主控器,计算和2D(或数据移动)。

如示意图所示,通过更紧凑的任务调动,可以使处理器始终在运行提前准备好的数据,从而带来全域5%的画图和计算性能提升。


ASTC HDR支持


Imagination此前已支持Khronos Vulkan API要求的自适应可缩放纹理压缩(ASTC)的低动态范围(LDR)。但是ASTC的高动态范围模式还不能支持。DXT系列新增的HDR功能,可以捕获更多的纹理信息,提高可视范围。

如图所示,从暗到亮,HDR支持可以展现更多细节。


总结


凭借着在光线追踪技术的领先,Imagination实现了GPU IP的准确定位,在如今竞争激烈的市场中,可以与其他便携甚至桌面级供应商扳一扳手腕。Imagination通过推出更具性价比,更低功耗,更高性能的DXT系列,意图将光追技术迅速普及开,从而在GPU市场中继续保持差异化的领先性。




展开阅读全文

页面更新:2024-05-18

标签:系列   纹理   功耗   新阶段   光线   片段   处理器   性能   效果   硬件   更多   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top