三风扇冰极散热,1080p全特效畅玩!耕升GeForce RTX 4060 Ti 8GB踏雪

随着NVIDIA GeForce RTX 4060系GPU的发布,各大AIC厂商的非公版RTX 4060系显卡也在市场上逐一亮相。作为核心AIC厂商之一的耕升,也随着NVIDIA的步伐推出了RTX 40系“60”家族的首款RTX 4060 Ti 8GB显卡——耕升GeForce RTX 4060 Ti 8GB踏雪。

在NVIDIA RTX 4070 GPU发布时,耕升推出了全新的“踏雪”系列,在我们进行RTX 4070显卡全面首发评测时,来自耕升的正是首款“踏雪”系列——RTX 4070踏雪。当GeForce RTX 4060 Ti 8GB GPU作为RTX 40系的“60”家族首位成员亮相市场时,耕升也推出了自己的第二款“踏雪”产品——GeForce RTX 4060 Ti 8GB踏雪(后文简称“RTX 4060 Ti踏雪”)。

复习内容:RTX 4060 Ti GPU核心解析

作为首发上市的“60”家族成员,RTX 4060 Ti GPU在架构上是完全传承了RTX 40系GPU Ada Lovelace核心的全部精髓。采用第三代光追核心和第四代AI核心设计,第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。

同时,在SM单元的设计上也是全新进化,效率达到了上一代的2倍。RTX 40系GPU所支持的着色器执行重排序SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。着色器执行重排序 SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%以上。

DLSS 3与OFA光流加速器

基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:帧生成技术、超分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。

为DLSS 3优化,更高效的GPU存储系统设计

GPU的存储系统整体由L1缓存、L2缓存、显存(位宽、带宽、频率)以及系统内存四部分组成。

▲L1缓存位于SM单元内,与CUDA核心几乎是一体的。

▲L2缓存,位于RTX 40系GPU芯片内,通过高速总线桥梁与SM单元(GPC)通信,由所有SM单元共享。

▲显存位于显卡的PCB板上,通过显存控制器总线与GPU核心通信。

GPU在工作时需要频繁且有效地访问数据,数据访问越快、越准确,那么GPU所表现出来的游戏或创作性能就越高。在RTX 40系GPU的每个SM单元内都存在一个超低延迟的L1缓存,这是CUDA核心、AI核心和光追核心在进行计算时的数据访问首选项,理论速度上它是最快的。但由于L1缓存位于SM单元内,因此不可能设计得非常大(空间、散热与成本的综合考虑)。

如果GPU的核心在L1中访问不到所需要的运算数据,那么就会转向L2缓存中寻找,在L2缓存中如果找到了所需数据,则会直接调用到GPU内核,这叫缓存信息命中。反之,如果在L2缓存中仍然找不到数据(缓存信息缺失),那么就要由GPU的显存控制器通过显存总线接口去访问GPU外部更大容量的显存,这一速度是远低于访问GPU内部缓存的,而且产生了额外的工作流程。相比L1、L2缓存的信息访问而言,在性能和功耗效率上都大大降低了。

传统GPU的存储系统设计中,如果在较低的L2缓存设计下,访问未命中的情况会比较多(图中红色部分),此时这些访问未命中的数据就需要通过总线接口到显存(VRAM)中寻找,速度大大降低。如果显存中仍然未找到需要的数据,那么就要通过系统总线去访问系统内存,并复制到显存中进行调用,这一过程是效率最低的。

RTX 40系GPU上,L2缓存容量得到了极大增强,RTX 4060 Ti GPU配置了32MB的大容量缓存,大大提高了L2缓存中的访问命中率。因此在相同甚至更低的显存带宽下,大容量的L2缓存设计能有效提升GPU核心的效率,表现在游戏性能上就是大幅度提升了游戏帧率。

简单来讲,更高的L2缓存设计能极大提升GPU的数据访问命中率,从而让GPU核心能在整体显存带宽和容量成本控制上有更大的冗余空间,且拥有更高的效率。尤其是对于DLSS 3来说,更大的L2缓存也在很大程度上提升了DLSS 3的执行效率,对整体游戏性能的表现提升有着巨大贡献。

更多的GPU存储系统控制理论在这里我们就不赘述了,后续我们会专门出一篇相关的技术解析文章为读者解惑。

新一代NVIDIA编码器(NVENC)

RTX 40系GPU全部采用了第八代NVENC编码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。RTX 4060 Ti也搭配了第八代NVENC编码器和第五代NVDEC解码器。

更强的Studio性能

除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。

同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:

●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI

特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。

●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升 2倍。

●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。

●Modder可以重制经典游戏,并通过RTX Remix开启RTX。

熟悉的纯白风,160W的三风扇甜品卡

耕升RTX 4060 Ti踏雪采用的是代号为AD106的Ada架构核心,不过在完整的AD106核心基础上减少了2组SM模组,共有三个GPC、34个SM模组。因此,RTX 4060 Ti 8GB配置了34个第三代光追核心和136个第四代AI核心,拥有4352个CUDA核心。同时,GPU配置了4个32bit的16Gb GDDR6显存控制器(每个控制器控制2GB显存),实现了128bit的显存带宽和8GB GDDR6显存容量配置,整体显存带宽为288GB/s。

和前一代的RTX 3060 Ti FE相比,RTX 4060 Ti FE 8GB在CUDA核心数和显存位宽略微落后,不过在L2缓存容量上达到了前者的8倍之多,结合更高效的SM单元和更高的核心频率,因此在游戏运行效率上有望超越RTX 3060 Ti不少。再加上DLSS 3的支持,RTX 4060 Ti FE 8GB的游戏性能表现还是可以期待的。

耕升RTX 4060 Ti踏雪仍然遵循了纯白色调的美学设计,和RTX 4070踏雪一样,纯白的外框搭配纯白风扇,很能凸显出一种“雪景”的美感,能够给喜欢打造白色系主机的玩家提供更多的选择空间和思路。

耕升RTX 4060 Ti踏雪采用标准双槽设计,整卡厚度只有40mm,长290mm,显卡兼容性强,纤巧的体积更大大减低对机箱空间的要求。


顶部设计了ARGB灯效,为显卡整体颜值表现起到了画龙点睛的作用。

显卡外框采用了白色ABS塑料材质搭配珍珠漆质感的同色涂装,保持了色调的一致性,也增添了明亮的气息。相比RTX 4070踏雪,RTX 4060 Ti踏雪的外框暗花拉丝表面处理效果略有改变,正面、顶部和底部增添了几处灰色的装饰。

背部采用了高穿透式散热背板,显卡背板右方进一步加大积镂空间,配合散热器上第三组风扇的风流直接穿透散热鳍片以及镂空的PCB设计,能够令显卡温度进一步下降。

电源接口和RTX 4070踏雪一样采用的是传统8pin接口,方便老电源用户平滑升级。

标准的3DP 1.4a+1 HDMI 2.1输出接口配置

和RTX 4070踏雪一样的全新风雪散热系统,配备3个82mm的“炫风之刃风扇”,经改良后提升风流量,并减低声噪,有效加强散热;支持智能启停;在散热片部分,RTX 4060 Ti踏雪拥有2根6mm直径的镀镍复合热管、大面积高效能铜板和紧密散热鳍片,结合回流焊接工艺,可以带来较强的散热性能。

耕升RTX 4060 Ti踏雪采用了6层板的短PCB设计,6+1相供电,电气性能足以满足RTX 4060 Ti 8GB GPU的需求。

代号为AD106-350-A1的RTX 4060 Ti 8GB GPU核心

显存部分则是来自三星的GDDR6颗粒,单颗容量2GB,共4颗构成8GB容量。

耕升GeForce RTX 4060 Ti 8GB踏雪产品参数

核心架构:Ada Lovelace

核心代号:AD106-350

制程工艺:TSMC 4N定制

SM单元:34

CUDA核心数(流处理器):4352

光追核心数(RT Cores):34

AI核心数(Tensor Cores):136

核心频率:2310MHz~2595MHz

显存容量:8GB GDDR6

显存速率:18Gbps

显存位宽:128bit

显存带宽:288GB/s

支持DLSS版本:DLSS 3

TGP:160W

建议搭配电源额定功率:450W

显卡厚度:双槽

首发参考价格:3299元

性能实战,1080p全特效光追游戏无忧

按照官方的市场定位,RTX 4060 Ti 8GB GPU主要面对的是1080p游戏市场。在实际性能测试环节中,我们将主要考察耕升RTX 4060 Ti踏雪显卡在游戏性能和设计创作性能两大方面的实际表现。综合玩家的实际情况与显卡升级的需求,我们将前一代的GeForce RTX 3060 Ti (8GB GDDR6)和RTX 2060 SUPER显卡加入作为对比性能参考,主要看看对还在使用RTX 3060 Ti、RTX 2060 SUPER这类老显卡的用户来说,从RTX 20系的“60”家族升级到RTX 40系的“60”家族,能带来多大的性能提升。

测试平台

GPU:耕升RTX 4060 Ti 8GB踏雪、RTX 3060 Ti FE、RTX 2060 SUPER FE

CPU:英特尔酷睿i9-13900K

主板:英特尔Z790

内存:影驰名人堂DDR5 6000 32GB

电源:鑫谷昆仑冰山1250W(ATX 3.0)

显示器:戴尔UP3218K(7680×4320@60Hz)

操作系统:Windows 11 Pro 22H2

显卡驱动:NVIDIA Game Ready Driver 531.93

3DMark

3DMark理论性能测试部分,整体综合成绩来看,耕升RTX 4060 Ti踏雪性能上领先RTX 3060 FE在10%~15%左右,领先RTX 2060 SUPER FE在55%以上。

传统游戏性能测试

在主流的1080p游戏环境下,最高画质与最高光追效果设置下与前一代的对位产品RTX 3060 Ti 相比,耕升RTX 4060 Ti踏雪的性能领先前者约15%~18%,表现还是比较不错的。而与更前一代的图灵核心的RTX 2060 SUPER FE相比,耕升RTX 4060 Ti踏雪的整体游戏性能领先更是达到了75%以上,这无疑大大增添了从RTX 2060 SUPER升级到RTX 4060 Ti的价值。

同时我们可以看到,在最高画质、最高光追特效设置下,开启DLSS之后,耕升RTX 4060 Ti踏雪几乎在所有游戏中都实现了60fps+的流畅游戏水平,在半数以上的游戏中甚至都达到了100fps+的绝对流畅游戏水平线,表现不错。

1440p分辨率下的测试结果与1080p分辨率下基本一致,耕升RTX 4060 Ti踏雪的性能仍然领先RTX 3060 Ti约10%~15%,领先RTX 2060 SUPER则达到了70%以上。

DLSS 3性能

作为RTX 40系GPU的最大黑科技,DLSS 3目前已经受到了越来越多游戏的支持,而且纵观新近推出的游戏大作,半数以上几乎都提供了对DLSS 3的支持。同时,由于DLSS 3技术中已经集成了NVIDIA Reflex低延迟技术,因此开启DLSS 3之后还能顺带享受到更平滑无卡顿的游戏体验,而且1%L fps这个影响游戏卡顿的重要指数也在开启DLSS 3之后会得到大幅度的提升。

我们选择了8款已经上市的支持DLSS 3的新游戏大作进行了详细测试。从测试结果来看,开启DLSS 3之后确实为耕升RTX 4060 Ti踏雪带来了非常显著的游戏性能提升,整体的提升幅度超过了100%,最高的甚至达到了200%以上。在《霍格沃茨之遗》游戏中,1080p分辨率下不开启DLSS时游戏帧率仅为39fps,开启DLSS 3之后游戏帧率猛涨到了105fps的绝对流畅运行水平。

与此同时,开启DLSS 3之后,在NVIDAI Reflex的作用下,游戏的系统延迟PCL也得到了极大的降低,比如在《巫师3:狂猎》游戏中,1440p分辨率下关闭DLSS和Reflex时,游戏的系统延迟高达193ms,而开启DLSS 3之后,游戏的系统延迟则降低到了72ms,降低幅度超过了60%。这也意味着开启DLSS 3之后玩家能够享受到更加平稳、丝滑的游戏体验。

在同一平台上,我们看看开启DLSS 3之后,前后代产品的性能横向对比。从测试成绩可以看出,开启耕升RTX 4060 Ti踏雪在开启DLSS 3之后,相比只支持DLSS 2的RTX 3060 Ti来说,在1080p分辨率下的性能领先达到了80%左右,在1440p分辨率下的性能领先也达到了60%以上。对比更前一代的也仅支持DLSS 2的RTX 2060 SUPER,开启DLSS 3之后的耕升RTX 4060 Ti踏雪性能更是达到了后者的2.6倍以上。可见DLSS 3为耕升RTX 4060 Ti踏雪的游戏性能再添了一枚有力的砝码。

设计与创作性能测试

RTX 40系GPU在我们之前的多番测试中均在设计创作上有比较优秀的表现,那么对于面向主流消费群体的甜点级产品之一RTX 4060 Ti 8GB来说,它在设计创作性能上是否也有一战之力呢?

首先看视频转码部分的Davinci Resolve Studio 18的测试。在测试中,RTX 4060 Ti踏雪在视频转码性能上相较于RTX 3060 Ti有15%~20%的性能领先幅度,相对于RTX 2060 SUPER的性能领先更是达到了30%~80%。显然,耕升RTX 4060 Ti踏雪的GPU核心所配置的第八代NVENC编码器有着更高效的执行效率,在性能的表现上也更加出彩。

这里还是要强调一下RTX 40系GPU的第八代NVENC编码器所支持的AV1格式硬件编码加速。AV1格式相比H.264等传统视频格式,在同码率下的视频质量更优秀,同时占用的体积也较小,代表着未来的视频主流方向。对AV1格式硬件编码加速的支持,也是RTX 40系GPU的特色之一。

我们用OBS录制了《毁灭全人类2:重新定位》游戏中的一段原始视频,并在Davinci Resolve Studio中用耕升RTX 4060 Ti踏雪将其分别转码输出为1080p@30fps、6000Kbps码率的H.264格式(图右)和AV1格式(图左)的两段视频。通过在NVIDIA ICAT软件中的逐帧比较分析,可以清晰地看到,AV1格式的视频在相同码率下视频质量明显比H.264格式的视频要优秀得多(图片可点击放大观察)。

在3D渲染能力测试的Blender Cycles、Blender Opendata Benchamrk和V-Ray Benchmark的测试中,耕升RTX 4060 Ti踏雪的整体性能仍然有着比较明显的优势,领先RTX 3060 Ti约20%,领先RTX 2060 SUPER达到了40%以上。这说明耕升RTX 4060 Ti踏雪在设计创作性能上,仍然是有一战之力的。

AI性能

最后来看看耕升RTX 4060 Ti踏雪在热门的AI计算相关场合中的性能表现,也可以顺带考核RTX 4060 Ti 8GB GPU的CUDA核心效率与第四代AI核心的性能表现。

ON1 Resize AI 2022软件中,在图片的AI缩放处理工作上,耕升RTX 4060 Ti踏雪的性能优势非常明显,相对于RTX 3060 Ti领先约25%,相对于RTX 2060 SUPER的领先程度更是达到了40%以上。表现还是比较不错的。

在Stable Diffusion的AI图片生成性能测试中,在同一关键词和相同的生成条件设置下,RTX 4060 Ti踏雪1张图片生成耗时4.72秒,4张图片生成耗时19.51秒,对比RTX 3060 Ti的5.83秒和23.98秒,在性能上仍然有20%以上的领先优势。对比RTX 2060 SUPER,性能领先更是在40%以上。

最后来看下比较好玩的NVIDIA RTX VSR视频超分辨率技术体验。在RTX 4070发布时,NVIDIA就正式在驱动控制面板中实现了对VSR的支持。简单来说,它可以通过AI计算的细节增强,让视频播放更加清晰。

目前要实现VSR需要两个硬性条件,其一是必须基于RTX 30系以上的GPU并得到驱动程序的支持,其二则是需要支持VSR功能的浏览器或播放器。我们测试所用的Game Ready Driver 531.91驱动程序已经开放了对VSR的支持,我们就通过FireFox浏览器(不支持VSR)和Google Chrome浏览器(支持VSR),播放两段来自Bilibili网站的视频,来体验一下RTX VSR的表现。

在东方废土题材的游戏《Ashfall》的演示视频中,同样可以看到在Chrome浏览器(图左)中开启VSR之后,相比FireFox浏览器播放时,视频质量得到了明显的增强,清晰度更好,细节更丰富(点击放大观察)。

温度与功耗

高能耗比是RTX 40系GPU的一大主要特色,之前我们测试RTX 4090、4080和4070系时也多次得到了验证。那么对耕升RTX 4060 Ti踏雪来说,它在实际应用中会有怎样的功耗表现呢?在测试中,我们选择了《赛博朋克2077》《卧龙:苍天陨落》《霍格沃茨之遗》《仁王2》以及《古墓丽影:暗影》共5款游戏分辨在1080p和1440p分辨率下测试了RTX 4060 Ti踏雪的功耗表现。最终数据显示,在1080p分辨率下,耕升RTX 4060 Ti踏雪的平均游戏功耗约为138W左右,在1440p分辨率下的平均游戏功耗约为147W左右。而在相同的条件下,RTX 3060 Ti的平均游戏功耗已经达到了200W左右,RTX 2060 SUPER的游戏功耗也达到了170W左右。结合在游戏中的性能表现,耕升RTX 4060 Ti踏雪在能耗比上确实表现出了巨大的优势,与前一代产品拉开了巨大差距。

在温度控制方面,耕升RTX 4060 Ti踏雪在FURMARK烤机20分钟左右之后,核心温度保持在63℃左右,对于主打轻薄的耕升RTX 4060 Ti踏雪来说,这个成绩已经算是非常不错的了。

最后来看下耕升RTX 4060 Ti踏雪的超频性能。尽管出厂时已经进行了与超频,不过耕升RTX 4060 Ti踏雪还是有一定的额外超频空间。在调校之后,耕升RTX 4060 Ti踏雪能在2850MHz核心Boost频率和2375MHz显存频率的设置下通过全部稳定性测试,最终的成绩相比超频前提升约5%。当然,我们没有进行极致超频的深度研究,有兴趣的玩家可以自己尝试。

万元以下装机的不错选择

尽管出于市场定位和成本考虑,NVIDIA对AD106核心整体缩减得相对比较厉害,这也导致RTX 4060系GPU的纸面规格并不算太好看,不过从实际性能表现上来看,耕升RTX 4060 Ti踏雪虽算不上有特别出色的性能表现,不过还是展现出了作为RTX 40系GPU应有的特色。在传统游戏性能上领先RTX 3060 Ti 15%左右,领先RTX 2060 SUPER 60%以上,这些都可以成为这些老显卡用户升级的选择理由。同时,在DLSS 3的支持下,耕升RTX 4060 Ti踏雪还能迸发出超强的性能提升,也就意味着它还是一款战未来的产品。同时,在设计创作领域,凭借第八代NVENC编码器和更高效的CUDA级Tensor Core,它也有非常不错的表现,算得上是能文能武。

从产品本身来看,耕升RTX 4060 Ti踏雪的产品设计非常轻薄,整体轻盈,而且采用了薄卡型和纯白色系搭配,3风扇配置使其在散热性能也有非常不错的表现。对于那些想要在万元内组装小钢炮的玩家来说,如果你正好还是一个白色系的“偏执狂”,显卡部分预算也还算充足,那么就可以考虑升级到这款显卡,让你的整机与桌面更搭。

展开阅读全文

页面更新:2024-04-02

标签:三星   编码器   功耗   显存   缓存   风扇   显卡   特效   性能   核心   测试   游戏

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top