Computex 2021上,NVIDIA双发,GeForce RTX 3080 Ti与GeForce RTX 3070 Ti接连登场,定价分别为8999元和4499元。从定位来看,价格更便宜的70系列GPU更接近多数人的攒机预算,它的表现将决定主流玩家们未来2、3年时间内玩游戏的酸爽程度。
而这一次,NVIDIA确实没有让人们对GeForce RTX 3070 Ti失望,GA104核心毫无保留,直接满配拉满,并给予了高端显卡待遇的GDDR6X显存,看样子就很能一战。那么GeForce RTX 3070 Ti是否真如我们所想象的那般让此次GPU升级变得物有所值?现在就让我们奉上NVIDIA GeForce RTX 3070 Ti Founders Edition的首发评测。
FE新设计
不同于GeForce RTX 3070 Founders Edition,GeForce RTX 3070 Ti Founders Editon公版在外观上再次发生了重大的变化。原本双风扇朝向一侧的设计变成了NVIDIA旗舰阵营才有的前后双风扇系统,由NVIDIA独家定制。
前后双风扇系统的特点在于,能够同时兼顾静音和散热的效果。事实上也是如此,如果在默认设置下对显卡进行半小时以上的压力测试,GeForce RTX 3070 Ti Founders Edition的风扇转速也仅仅会控制在60%左右,风扇噪音并不明显。
而在发热表现上,GeForce RTX 3070 Ti与一周前我们讨论的GeForce RTX 3080 Ti情况有点类似。压力测试下,GPU核心温度达到81℃,在RTX 30系GPU中属于最高,但情况仍然优于RTX 2080 Ti。
同时需要注意,显存温度会达到94℃,属于美光GDDR6X显存的正常表现水平。也因为如此,Founders Edition才会用上与旗舰系列相一致的散热模式。所不同的是,RTX 3070 Ti Founders Edition的PCB并非燕尾形状,而是改成了弧形,同样有利于后方风扇导风散热。
如果使用测温设备,可以看到表面温度最高67℃左右。显然,我们可以期待AIC版本进一步增强散热。
满血GA104
引发GeForce RTX 3070 Ti如此炙热的原因主要源自于GPU和显存,并且对于台式机用户而言,用本来就富足的空间、功耗兑换性能是完全值得的。
先说GPU,GeForce RTX 3070 Ti核心型号为GA104-400-A1,基于Ampere架构,在三星8nm NVIDIA定制工艺下,芯片面积(Die Size)达到392 mm²,总共包含了174亿个晶体管。
事实上我们在一年前分析GeForce RTX 3070的GA104-300-A1核心就可以推断出,GA104完全体将留给第二年GPU使用。因此GeForce RTX 3070 Ti获得了完整的GA104核心,拥有6个GPC(图形处理簇),每个 GPC 里包含有 4 个 TPC(纹理处理簇),每个 TPC里有2组StreamingMultiprocesor(流式多处理器,SM,对应 OpenCL 中的概念就是 CU,Computing Unit),每个SM里包括128个CUDA Core,4个第三代Tensor Core,以及1个第二代RT Core。
以此类推,我们就可以得知GeForce RTX 3070 Ti总共拥有48组SM,6144个CUDA Core,192个第三代Tensor Core,48个第二代RT Core。与相邻定位的几款GPU规格对比如下。
能够看到的是,凭借着1770MHz的GPU频率,RTX 3070 Ti就能在理论上获得比RTX 3070多出7%的计算与着色器性能,以及3%的像素吞吐量。也意味着RTX 3070 Ti对比RTX 3070的提升会比RTX 3080 Ti到RTX 3090之间的性能差距更为明显。
但这远远不够。不要忘了,NVIDIA在赋予RTX 3070 Ti完整GA104的同时,还获得了8GB GDDR6X显存加持。GDDR6X相当于GDDR6进阶版,由美光与NVIDIA共同研发,能够每个时钟内发出4个不同的信令,本质上是每个时钟内实现2次位移,并且分成4级电压阶跃(4种信号电平),即PAM4。GDDR6X旨在通过在内存总线上使用多级信令来实现更高的内存总线速度,并获得更大的内存带宽。唯独可惜的是,RTX 3070 Ti显存位宽仍然保持在256-bit。
也因为如此,这使得RTX 3070 Ti显存时钟频率对比RTX 3070再增加了5Gbps,总内存带宽达到了608GB/s,比RTX 3070多出了36%。
完整GA104和GDDR6X的双重加持下,自然也使得功耗增加到了TDP 290W,比RTX 3070高了70W,同时比RTX 3080低了30W。其中GDDR6X是影响功耗增加的主要因素,对GDDR6X的功耗调整,并考虑如何将其装入笔记本,可能会成为NVIDIA未来一段时间会去考虑的问题。
除此之外,RTX 3070 Ti同样包含RTX 30系列GPU的所有特性,包括大家耳熟能详的第二代RT Core,第三代Tensor Core,以及PCIe 4.0和更灵活的浮点运算机制。简单地归纳如下:
第二代RT Core:新一代RT Core在一个周期中,可以完成4次层次化包围和BVH求交加速,再完成2次三角形求交。特别是针对运动中的物体,2个新增的模块可以更快的实现三角形求交。特别是在运动模糊特效的前提下,能让光线追踪性能比第一代RT Core提升8倍之多。
第三代Tensor Core:用于提升游戏帧率的深度学习超采样DLSS技术,虽然在Ampere架构中实际数量没有增加,反而减少,但实际吞吐量提升了两倍,可以在深度学习中抛弃不必要的分支,在保证准确度的前提下减少运算。随着时间推移,驱动更新后的DLSS的表现也会越来越好。
更灵活的浮点运算机制:Ampere架构的SM中引入了新的数据通道和多一倍的FP32 运算单元,使得每个SM的FP32运算单元数量提高了一倍,每个SM每个周期可以跑128个浮点FMA操作或者256次浮点计算。在宏观层面上,可以看做允许FP32和INT32并发执行,调用率更高。
PCIe 4.0接口:日渐主流的新一代标准,已经在AMD与Intel主流平台上普及。对于GPU而言,PCIe 4.0带来的升级不止是传输速率,包括Resizable BAR、RTX IO等诸多传输新技术均基于PCIe 4.0而来,其中诸多功能还能向上兼容PCIe 3.0。
至此可以看到,RTX 3070 Ti带来的改变主要集中在核心元件的性能提升上,接下来让我们投入实战,看看它的表现究竟如何。
重新定义70系
按照惯例,在测试RTX 3070 Ti之间先放出测试平台。这里使用10C20T的酷睿i9-10900K搭配ROG MAXIMUS XII EXTREME,以及Thermaltake内存和电源为主,具体配置如下:
同时我们还引入了GeForce RTX 3070、RTX 3080、RTX 2080 Ti、RTX 2070、RTX 2070 SUPER作为比较,所有版本均为Founders Edition。
在3DMark项目中,我们分别使用3DMark Time Spy、3DMark Time Spy Extreme、3DMark Fire Strike Extreme、3DMark Fire Strike Ultra作为对比。能够看到RTX 3070 Ti相比RTX 3070提升有7%到11%,相比RTX 3080落后在14%到22%左右。与此同时,RTX 3070 Ti相比昔日卡皇RTX 2080 Ti也仍然有10%的提升,相对RTX 2070 SUPER更是提升了40%以上。
在3DMark NVIDIA DLSS测试中,第三代Tensor Core优势愈发明显,RTX 3070 Ti相对RTX 2080 Ti能提升70%,相对RTX 2070 SUPER以及RTX 2070更是有140%和170%的提升。
3DMark Port Royal是用来测试实时光线追踪性能表现的场景,基本上能够看到RTX 3070 Ti能比RTX 3070提升11%,与RTX 2080 Ti相当,同时相对RTX 2070 SUPER和RTX 2070分别提升49%和67%。
Final Fantasy XV Benchmark在4K DLSS下进行的测试亦是如此,基本上看出RTX 3070 Ti能比RTX 3070获得12%提升,相比RTX 2080 Ti有5%的提升,并且相比RTX 2070 SUPER提升43%,相比RTX 2070提升60%。
玩游戏更畅快了
在游戏测试环节依然分成两个部分,一个是传统的游戏性能检测,另外一个则是结合DLSS和光线追踪技术,看看RTX 3070 Ti在主流游戏中的具体表现。由于RTX 3070 Ti表现非常能打,所以这里主要引用RTX 2080 Ti、RTX 3070和RTX 3080作为陪跑。
传统的游戏性能测试主要以4K分辨率为主,能够看出相对RTX 3070 Ti相对RTX 3070提升有6%到20%,而相对RTX 2080 Ti则可以提升2%到11%左右。相对RTX 3080,则有8%到21%的差距。
在光线追踪技术推出3年后,支持光线追踪和DLSS的游戏已经超过140款。可以这么说,3A大作支持光线追踪与DLSS也基本成为标配,无论对于开发团队还是对于玩家视觉体验而言,实时光线追踪技术再搭配深度学习超采样DLSS无疑都是很好的选择。
在光线追踪加DLSS测试中,能够看到RTX 3070 Ti相比RTX 3070提升了有10%左右,相比RTX 2080 Ti提升有7%到24%,当然也有部分场景持平。相对RTX 3080则仍然有14%到22%的差距。
同样,我们不要忘了RTX 3070 Ti基于PCIe 4.0带来的新功能。其中之一被称为自定义基地址寄存器容量,即Resizable Base Address Register,简称Resizable BAR。这是一套允许CPU直接读取完整GPU显存的技术,CPU可以突破256MB的缓冲区限制,将更多的图像纹理、着色器、几何图形留在显存上。
Resizable BAR实际表现能够向下兼容PCIe 3.0,不过需要取决于主板厂商更新BIOS意愿。一旦游戏和主板提供Resizable BAR支持,在同等环境下,RTX 3070 Ti还能给你额外的10%性能提升。
另外一个能够提升游戏体验的功能为NVIDIA Reflex,它与特定型号的高刷新率显示器和鼠标协同工作,能够修正CPU与GPU之间处理速度不匹配的问题,消除冗长,更重要的是让鼠标的点击指令更快的到达屏幕,系统响应甚至可以比开启之前提升进50%。
抓住创意瞬间
大多数游戏玩家实际上不会只用PC玩游戏,再加上GPU的应用范围愈发广泛,诸如Adobe、Autodesk等专业软件已经开始支持GeForce RTX加速。更重要的是,Quadro阵营与GeForce阵营之间的划分开始愈发模糊,针对更专业的市场NVIDIA则推出了RTX A系列。
对于既需要PC玩游戏,也需要PC完成作业、设计的在校大学生而言,GeForce RTX 3070 Ti无疑是较为理想的选择。
针对专业软件,我们先使用了SPECviewperf 2020作为判断,这是一款在图形工作站领域中最具权威的综合性测试软件,能够一次性包揽CATIA、Maya、Energy等工业级专业的软件检测,能够看到RTX 3070 Ti已经能够轻松应付基础的设计功能。
Adobe Premiere Pro CC则是当下主流的视频编辑软件,由于NVIDIA GPU本身在硬件上已经支持H.264和HEVC(H.265),只需要接入NVIDIA的视频编码API,就能实现GPU视频制作的加速。
因此在Adobe Premiere Pro CC中设置非常简单,只需要确保项目设置中的渲染程序基于CUDA加速,并且视频输出的时候由硬件执行即可。可以看到的是,RTX 3070 Ti输出视频的速度比10C20T的酷睿i9-10900K更快。
当然,我们也不能忘了光线追踪技术对专业软件的影响。Octane Render是一款基于GPU实现物理渲染引擎,利用其可以为Autodesk Maya、3ds Max、MAXON Cinema 4D提供独立的渲染场景,RTX 3070 Ti对比RTX 2080 Ti表现出来的优势十分明显,最高能有近49%的提升,可见第二代RT Core带来的改变是非常惊人的。
顺带值得一提的是,为了能够更好的发挥专业软件运行效率,NVIDIA GeForce Experience也加入了针对专业软件的优化。专业用户与玩家一样,只需要专注眼前的软件,而不是逼自己成为一个电脑专家。关于硬件性能的调优参数,都可以交给NVIDIA GeForce Experience来完成。
针对直播与视频通话,同步更新的NVIDIA Broadcast 1.2也提供了加强,你无需打造个专门的通话环境,只需要PC配备有摄像头,通过RTX 3070 Ti上的第三代Tensor Core,就能实现专业设备才能实现的效果。
例如通过摄像头或者普通的麦克风,AI就能实现背景干扰音降噪,包括突如其来的汪星人叫声,亦或者昆虫声,房间回音,RTX 3070 Ti都能实现不错的消除效果。视频方面亦是如此,在Broadcast 1.2版本中,你还能叠加多个特效,例如让画面同时具备背景虚化和人物对焦的效果。
从实际体感来看,Broadcast 1.2在虚化的效果和人物聚焦表现不错,特别是能够清楚分辨出背景杂物,椅背以及头像,并做出更自然的过度。而针对直播,Broadcast也已经开始支持OBS Studio 26以上版本。NVIDIA还为Broadcast建立了一个专门的社区,专门关于直播和视频通话的意见反馈以及功能。
向主流迈进
NVIDIA GeForce RTX 3070 Ti Founders Editon在使用过程中给人印象最深刻的是,它不仅提供了超越上一代卡皇RTX 2080 Ti的性能,得益于第二代RT Core和第三代Tensor Core,在针对光线追踪和DLSS加速上有着更好的体验,这也使得GeForce RTX 3070 Ti不仅能够轻松应付2K分辨率高刷新率游戏,还在专业软件领域中有所建树。
比起RTX 3080 Ti,RTX 3070 Ti的4499元起售价更具有诱惑力,并且针对主流应用和游戏相当能打,并且针对加密货币挖矿行为进行限制,光凭这些理由足以成为时下最合理的主流GPU选择之一。
同时,也必须承认RTX 3070 Ti在RTX 30系列中发热量突出,在选择AIC版RTX 3070 Ti的时候,建议多考虑一下散热模组表现,给榨取GPU剩余性能提供有利条件。
让人高兴的是,NVIDIA已经开始加大对GPU的供应力度,未来半年相信能看到更多的GeForce RTX 3070 Ti,只要价格合理,确实值得入手一块了。
页面更新:2024-02-28
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号