在Steam硬件调查中,NVIDIA GeForce GTX 1060占比位居榜首,随后推出的GeForce RTX 2060也同样杀入了TOP 5的行列。可以这么说,尾号为60的NVIDIAGPU正式跨入了玩家们的甜点区,它们的表现将代表着多数玩家在游戏中能获得什么样的体验。
在搭载GeForce RTX 3060 Laptop GPU的笔记本抢先开卖之后,桌面版GeForce RTX 3060也终于来到了众人面前。并且GeForce RTX 3060一登场就来了一个大招,显存直奔12GB GDDR6,功耗达到170W,建议定价2499元。
下了猛料的NVIDIA GeForce RTX 3060是否真如粉丝所愿跨入甜点区?RTX 3060能否如愿替代RTX 2060位置?这里让我们奉上iGame GeForce RTX 3060 Ultra W 12G首测,一探究竟。
用GA106定义甜点
聊GPU自然得从核心说起,从公布的GA106完整的图解来看,A106拥有3个GPC(图形处理簇),每个GPC下拥有5个TPC(纹理处理簇),每个TPC里包含2个Streaming Multiprocessor (SM)。
Streaming Multiprocessor (SM)的结构没有变化,即包含了1个第二代RT Core,4个第三代Tensor Core,以及128个CUDA Core用于处理FP32、INT32、FP64等运算。从总数量来看,GA106总共包含3个GPC、15个TPC、30个SM,以及3840个CUDA Core,30个第二代RT Core,120个第三代Tensor Core。
在iGame GeForce RTX 3060 Ultra W 12G上,删除了一组TPC,即实际拥有14个TPC,28个Streaming Multiprocessor (SM),以及3584个CUDA Core,28个第二代RT Core,112个第三代Tensor Core。具体的参数对比可以参考下图。
能够看到,GeForce RTX 3060最大的亮点是将显存直接拔高到了12GB GDDR6,同时没有了笔记本狭小空间的束缚,TGP达到了170W。官方给出的GPU最高频率,显存频率均高于同产品线水准。
眼前这块iGame GeForce RTX 3060 Ultra W 12G其实就是很好的例子。蒸汽波元素风格外甲和亮色搭配显得十分新颖,同时也符合时下流行的白色主机内部搭配。
更重要的是装甲之下是一套高效的散热技术。七彩虹用回流焊技术将散热鳍片与4根热管做无缝处理,帮助提升导热效率。其中2根热管直径达到了8mm,另外2根热管直径为6mm。
从压力测试环节看来,GA106的发热量不高,在半小时的FurMark测试下GPU最高温度为64℃,对比RTX 30系列GPU而言温度已经很低。
而从红外线测温来看,散热鳍最高温度在58℃左右,覆盖散热器的外甲则一直保持凉爽的程度。
把战斗力拉满
相比起散热,GeForce RTX 3060能否成为理想的“甜点”才是玩家们最关心的问题。如前面分析所言,GA106同样具备RTX 30系列最引以为傲的第二代RT Core和第三代Tensor Core。
其中,第二代RT Corce在图灵架构的基础上将三角形求交模块数量增加到两个,并且一并行的方式运作,同时还增加了一个三角形位置内插模块。这使得在一个周期内,BVH(层次化包围盒)求交和三角形求交比重,由图灵架构时代的4:1,提升到了2:1。
这使得GeForce RTX 3060的实时光线追踪性能表现依然不错,按照Boost频率1777MHz和28个RT Core推算出光线追踪时的三角形射线求交底层性能如下:
2 Triangle Intersection per RT Core * 1 RT Core per SM * 28 * 1777 MHz = 99.512 GTriInter/s
也就是说GeForce RTX 3060的三角形射线求交底层性能大约能达到GeForce RTX 3060 Ti的74%左右。另外第二代RT Core还增加了三角形位置内插模块,在实现运动模糊效果的时候,能起到明显的加速效果。
同时第三代Tensor Core通过每个Streaming Multiprocessor (SM)包含4个核心获得了与Turing架构8个第二代Tensor Core相同的性能。但得益于NVIDIA Ampere架构真传,GA106上的Tensor Core能够以4个权重为一组的方式,将已经训练好的权重分组中权重值为0的两个权重修剪掉,透过这个稀疏化处理,实现了推理准确无损情况下等效 100% 的深度学习性能提升,或者说等效每周期每个Streaming Multiprocessor (SM)完成1024个FP16 Tensor操作。这这使得第三代Tensor Core在每个时钟周期密集计算次数提升2倍,稀疏化加速计算次数提升4倍。
第二代RT Core和第三代Tensor Core结构上的优化将最终体现到了跑分上。在测试之前,让我们先列出本次不拖后腿的测试平台:
CPU:Intel Core i9-10900K
主板:ROG MAXIMUS XII EXTREME
内存:Thermaltake ToughRam RGB DDR4-4600 8GBx2
硬盘:Plextor M9P Plus 1TB x 2
电源:Thermaltake TPI RGB PLUS 1250W
散热:Thermaltake Floe Riing RGB 360
在3DMark Time Spy、Fire Strike场景测试中,GeForce RTX 3060相对RTX 2060提升在15%到19%左右,而一旦涉及DLSS和实时光线追踪,提升的效果愈发明显,特别是DLSS测试表现,提升达到113%。
新技术和新软件入局
你以为这就结束了?不。即便是同一架构下,每次伴随新硬件发布,NVIDIA的软件和技术也会随之更新。这一次随着GeForce RTX 3060更新的内容还包含能够实现自动超频的GeForce Experience性能板块,以及CPU直读更多显存,更进一步拔高游戏帧率的Resizable BAR。
默认按下快捷键Alt+Z,选择功能区右上角的性能,即可打开GeForce Experience的性能页面。在性能检测中能够看到频率、温度、电压、利用率等基本参数。
最关键的还是性能页面下方的性能调优,类似早期的OC Scanner,在开启自动调整选项之后,根据不同的GPU体质,GeForce Experience还能再帮助GeForce RTX 3060获得一定程度的性能提升。
比起手动超频,自动调整在实际体验中没有遇到蓝屏、画面死机的情况,也意味着GeForce Experience的自动调整更为实用。
在游戏体验中亦是如此,即使在部分测试中GeForce RTX 3060与RTX 2060 SUPER难分伯仲,在实际游戏中优于后者,同时相对RTX 2060提升达到20%到50%,甚至《德军总部:新血脉》中由于RTX 2060显存吃紧,最终让RTX 3060提升了213%。
一旦开启光线追踪和DLSS深度学习超采样,GeForce RTX 3060相对RTX 2060的优势更为明显,游戏提升普遍在20%到60%,同样是《德军总部:新血脉》,RTX 2060由于显存爆表分数惨不忍睹。
挖掘RTX 3060潜能的Resizable BAR
如果说超频是常规操作,那么允许CPU完整访问显存的Resizable BAR功能则可以将游戏帧率再网上提升一步。受限于早期PCIe规范,CPU通常只能通过Base Address Register(BAR)将256MB系统内存映射到显存上,随着游戏数据的不断增长,游戏帧率将会受到严重限制。
现在Resizable BAR加持下,只要主板提供相应的支持,CPU就能直接访问所有显存。以ROG MAXIMUS XII EXTREME为例,在更新到最新版BIOS之后,可以直接在界面右上角的ReSize BAR直接开启功能,亦或者在Advanced的PCI Subsystem Settings中手动将Re-Size BAR Support调整为Auto。
进入系统之后,我们就能在NVIDIA控制面板的系统信息中看到Resizable BAR已经被自动开启。
从目前的体验来看,有部分游戏已经开启了对Resizable BAR支持,游戏帧率甚至可以更进一步提升7%至11%左右,比GPU超频获得更多。
加分项:体验再迈进一步
在NVIDIA的游戏生态下,其实早已跳出单纯的游戏帧率,NVIDIA Reflex技术就是一个很好的例子。目前包括《堡垒之夜》、《Valorant》、《Apex英雄》、《COD17:黑色行动冷战》、《COD:战区》都加入了对NVIDIA Reflex技术的支持。
大体而言,游戏中融入的NVIDIA Reflex SDK能够更好的控制CPU运行速度,确保鼠标点击、CPU、GPU保持同步,以获得最快的系统响应速度。这对于毫秒必争的经济类游戏而言,多出几毫秒的判定甚至扭转整个战局。如果说Resizable BAR是即将全面普及的技术,那么NVIDIA Reflex相信在很长时间内只会有N卡独占。这也是电竞赛事主机更倾向于使用NVIDIAGPU之一。
另外一个就是直播功能。即便是上千元的摄像头,指望摄像头本身搭配智能功能仍然不显示。而与GeForce RTX 3060搭配的NVIDIA Broadcast,则可以将普通PC摄像头变成将类似于智能手机的镜头。
原因在于NVIDIA Broadcast利用了Tensor Core的AI加速功能,利用普通的摄像头和麦克风,就能实现环境音智能降噪、虚拟/虚化背景,如果摄像头角度够广,NVIDIA Broadcast还能通过自动裁切画面的形式模拟一个跟随镜头。对于游戏主播、视频会议聊天而言,这套功能非常有用。
最后我们来聊聊游戏之外。大部分用户不可能只用GPU来玩游戏,随着GeForce RTX GPU获得更多专业软件的支持,GeForce RTX 3060同样能够承担起部分视频剪辑和专业内容创作的任务。
这时候12GB显存能够发挥出更多作用,例如帮助玩家应付4K高分辨率视频的剪辑,亦或者更为复杂的模型渲染。
这里通过GeForce RTX 3060和RTX 2060进行Premiere Pro CC 2020性能以及Octane Render的光线追踪加速作比较,其中Premiere Pro CC 2020进行了一段大约4分钟的4K视频输出,时间缩短了10%。
而Octane Render则是对光线追踪性能测试差距更为明显,Havana Scene DL场景光追性能提升了40%,Godrays Scene场景光追性能更是提升了60%以上。
写在最后:让2021年能愉快游戏
在近一年多的时间中,矿主对虚拟货币的狂热让游戏GPU几乎一片难求。在宣布GeForce RTX 3060的同时,NVIDIA CMP专用矿卡同步推出,并且宣布将通过驱动限制GeForce RTX 3060的挖矿性能。
事实上GeForce RTX 3060也并非矿卡的最优选,NVIDIA对GA106的诸多挖矿性能限制或许能成为GeForce RTX 3060流向玩家的关键。
而作为游戏卡,GeForce RTX 3060本身无疑是有吸引力的,2499元起跳的价格,170W TGP,把游戏战斗力拉满的第二代RT Core和第三代Tensor Core,以及Resizable BAR技术,再加上诸多围绕NVIDIA游戏生态设计的增强体验,以及诸如iGame GeForce RTX 3060 Ultra W 12G这般充满个性化的外观,都让GeForce RTX 3060变得十分理想。
可以这么说,GeForce RTX 3060更像是GTX 1060和RTX 2060主流玩家升级的最优选,而玩家们也只需要一些耐心,在今年夏天前能愉快地玩上3A游戏,相信并不遥远。
页面更新:2024-01-31
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号