4月12日,NVIDIA GeForce RTX 40系列的第四位成员——NVIDIA GeForce RTX 4070正式公布。由于采用全新的NVIDIA Ada Lovelace架构,因此这位新成员也同样集成了前面几位大哥具备的新特性与黑科技,包括第三代RT Cores与第四代Tensor Cores以及可以让游戏帧率大幅提升的DLSS 3技术。而在这一天,精雕细琢后的许多非公版RTX 4070也同样来到了我们面前,比如我们今天要为大家介绍的七彩虹iGame GeForce RTX 4070 Ultra W V2,便是一款在核心频率方面与公版产品保持了相对一致的产品。而在此之外,它的外观、散热设计均有着自己特有的理念与思考,具体表现如何?我们接着往下看。
七彩虹iGame GeForce RTX 4070 Ultra W V2产品参数
核心架构:Ada Lovelace
(相关资料图)
核心代号:AD104
制程工艺:TSMC 4N定制
SM单元:46
CUDA核心数(流处理器):5888
光追核心数(RT Cores):46
AI核心数(Tensor Cores):184
核心频率:1920MHz~2475MHz
显存容量:12GB GDDR6X
显存速率:21Gbps
显存位宽:192bit
显存带宽:504GB/s
支持DLSS版本:DLSS 3
TGP:200W
建议搭配电源额定功率:650W
产品尺寸:337mm×150mm×60mm(含挡片)
首发参考价格: 4799元
基于Ada架构的新变化
“国际惯例”,在每一篇有关于NVIDIA GeForce RTX 40系列产品介绍之前,我们仍旧要为大家介绍一下Ada Lovelace架构以及它的新特性,由此来帮助那些近期有需要更换显卡的玩家与用户,更好地了解NVIDIA GeForce RTX 40系列的变化,这次新上市的NVIDIA GeForce RTX 4070也不例外。当然,如果读者朋友们对Ada Lovelace架构以及它的新特性、新功能已经了然于胸,可略过这部分解析,直接跳到产品评测阶段。
缓存暴增
Ada架构的改革在缓存部分有了较大改变。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,相比GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,相比之前GA102所拥有的6144KB大约是后者的16倍。如此巨大的缓存,将为所有GPU相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显。
更强的SM
AAD102的每个SM单元包含128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单元、256KB寄存器、128KB的L1/共享内存,和之前的产品一样,L1/共享内存也可以根据使用情况进行配置。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。
第三代光追核心
第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。
Shader Execution Reordering着色器执行重排序
着色器执行重排序SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。着色器执行重排序 SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
DLSS 3与OFA光流加速器
基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:帧生成技术、超分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。
新一代NVIDIA编码器(NVENC)
RTX 40系高端GPU实现了双第八代NVENC编码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。不过对RTX 4070来说,搭配的则是单个的第八代NVENC编码器和第五代NVDEC解码器。
更强的Studio性能
除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。
同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI 特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。
●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升 2倍。
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。
●Modder可以重制经典游戏,并通过RTX Remix开启RTX。
温暖明亮的一抹风情
年轻、个性是七彩虹iGame GeForce RTX 4070 Ultra W V2为我们带来的深刻印象,通过采用波普美学,它有着渐变、出彩的外观设计。
目前许多硬件厂商都有意识去打造一些偏明亮色的产品,无论是机电、外设,抑或是主板、电源,希望通过这样的方式,能够帮助玩家或用户打造更具个性,且更能符合整个室内装饰的桌面Mod。而七彩虹iGame GeForce RTX 4070 Ultra W V2也是这样的存在,它在设计时便引入了波普美学的理念,通过在机身上采用高饱和色调,从而带来明快、舒适的感觉,既能够凸显产品的个性与设计,也能够带来抢眼的视觉效果——它的机身表面采用贝壳渐变色,搭配许多波点,随着光线照射的角度以及强弱从而能够带来不同的色彩效果,正视时为蓝色,视角或光线移动后,则会变换为紫、红、黄等暖色调。
▲显卡顶部设计了一个具备漫画风格的RGB背光灯,背光灯中间的“Ultra”字样表明了其身份。
另外,装甲正面还加入斜切设计以及偏科幻的“Ultra”字样装饰再搭配右下角的Logo,设计感突出的同时也起到了画龙点睛的作用。将视野转至显卡的顶部,我们可以看到,其右侧设计了具备波普风格的RGB背光灯,同时它的表面也印刻了“Ultra”字样,同时它的周围还设计了漫画集中线效果,相当特立独行。
▲接口方面,七彩虹iGame GeForce RTX 4070 Ultra W V2配备了3DP 1.4a+1DMI 2.1的组合,并且一旁还设计了一个双Bios按键。
▲七彩虹iGame GeForce RTX 4070 Ultra W V2采用支持PCIe 5.0规范的ATX 3.0标准镀金16Pin供电接口。
▲金属背板的风格与正面装甲保持了相对的一致,有着出色的设计感,且尾部采用镂空设计。
除了波普风的正面装甲引人入胜之外,七彩虹iGame GeForce RTX 4070 Ultra W V2的背面同样在设计方面下足了功夫——白底的金属背板上涂装了粉色的艺术字样以及灰色的波点装饰,整体显得颇为活泼,而背板左下角的“Ultra”的字样,与顶部、正面的字样达成了联动效果,称七彩虹iGame GeForce RTX 4070 Ultra W V2是无死角的高颜值显卡也不为过。当然,厚实的金属背板除了能够起到提升颜值的作用之外,还具备加固PCB作用,尾部的大面积开孔则能够加速显卡内部散热效率。
▲七彩虹iGame GeForce RTX 4070 Ultra W V2的正面100mm风扇拥有9片经调校后的扇叶,同时,中间印刻了iGame Logo。
波普散热,确保稳定
优良的散热配置可以确保高性能显卡能够发挥出充分的性能表现,因此七彩虹iGame GeForce RTX 4070 Ultra W V2配备了波普散热装置——其正面搭载了3个拥有九翼环型扇叶的100mm风扇,它能够带来充足的进风量,从而提升显卡内部的散热效率。同时,七彩虹iGame GeForce RTX 4070 Ultra W V2支持智能启停技术,当显卡处于低负载状态下时,正面的3个散热风扇会自动停转,从而降低显卡产生的噪音,保障风扇的使用寿命。另外,散热器的内部配备了6根6mm热管,加上大面积的散热鳍片,能够有效提升热交换面积。
▲散热器内部拥有6根6mm热管,配合大面积的散热鳍片,能带来优秀的散热效果。
▲PCB上面预留了充足的空间,同时它采用了8+3相供电设计。
▲七彩虹iGame GeForce RTX 4070 Ultra W V2搭载的代号为AD104-250-A1的核心具备5888个CUDA核心数量。
▲七彩虹iGame GeForce RTX 4070 Ultra W V2使用了6颗源于美光的2GB GDDR6X显存
▲根据GPU-Z,我们可以看到七彩虹iGame GeForce RTX 4070 Ultra W V2在频率方面与公版RTX 4070保持了相对的一致。
而在PCB方面,七彩虹iGame GeForce RTX 4070 Ultra W V2的PCB板设计并不拥塞,预留了足够的空间,使得整个内部热量更容易逸散,同时显卡内部的显存、供电电路部分均采用导热贴片进行降温处理。供电方面,这款产品采用8+3相供电,能够确保内部元件需要。核心规格方面,七彩虹iGame GeForce RTX 4070 Ultra W V2搭载了基于Ada Lovelace架构的AD104核心,其拥有46个光追核心(RT Core)、240个AI核心(Tensor Core)以及5888个CUDA核心。在核心规格配置上,相比RTX 4070 Ti精简了大约四分之一。该核心的默认频率为1920MHz,bosst频率为2475MHz,与公版RTX 4070保持了相对的一致。显存方面,七彩虹iGame GeForce RTX 4070 Ultra W V2选用了6颗容量为2GB的美光GDDR6X显存,显存位宽仍然为192bit,总带宽为504GB/s,与RTX 4070 Ti保持一致。那么具体到实际测试中,这款设计特别的显卡又会有怎样的表现呢?
测试平台
GPU:七彩虹iGame GeForce RTX 4070 Ultra W V2、RTX 3070 FE、RTX 3070 Ti FE、RTX 2070 SUPER FE、七彩虹战斧RTX 4070 Ti(部分测试)
CPU:英特尔酷睿i9-13900K
主板:技嘉AORUS Z790 MASTER
内存:影驰名人堂DDR5 6000 32GB
电源:鑫谷昆仑冰山1250W(ATX 3.0)
显示器:戴尔UP3218K(7680×4320@60Hz)
操作系统:Windows 11 Pro 22H2
显卡驱动:NVIDIA Game Ready Driver 527.62
AMD Software Adrenalin Edition 22.12.2
GPU基准性能测试
Ada Lovelace架构对NVIDIA GeForce RTX 40系显卡的提升是全方位的,从3DMark理论性能测试中我们能够明显地看到,即便是在应对上代RTX 3070 Ti FE时,七彩虹iGame GeForce RTX 4070 Ultra W V2在所有的3DMARK测试项目中均有明显的优势,比如FireStrike、TimeSpy,它分别得到了44713、18195,RTX 3070 Ti FE仅有34940、15112,前者较后者的提升幅度分别为27%、20%。而旨在考察光线追踪、实时全局光照技术的3DMark Speed Way测试项目中,七彩虹iGame GeForce RTX 4070 Ultra W V2表现同样抢眼,4519的得分超过了RTX 3070 Ti FE 27%。而当对比对象替换为RTX 4070 Ti之后,七彩虹iGame GeForce RTX 4070 Ultra W V2与之差距保持在22%左右,这样的表现也符合预期。
传统光追游戏性能测试
新构架以及第三代光追核心使得RTX 40系显卡能够在传统光追游戏性能中得到更出色的帧率表现,七彩虹iGame GeForce RTX 4070 Ultra W V2也不例外,再搭配12GB GDDR6X之后,它可以更好地处理目前绝大多数游戏在1080p与1440p分辨率下的性能需要,即便是最热门的3A大作也不例外——在关闭DLSS功能、进行光追游戏测试的情况下,七彩虹iGame GeForce RTX 4070 Ultra W V2在对比RTX 3070时,1080p分辨率下的测试成绩平均领先30%,1440p分辨率下的测试成绩平均领先35%;当对比对象换成RTX 3070 Ti时,七彩虹iGame GeForce RTX 4070 Ultra W V2同样能够在1080p、1440p分辨率下,平均领先21%、23%,特别是在《最后的生还者:第一季》中,1440p分辨率下七彩虹iGame GeForce RTX 4070 Ultra W V2的综合领先幅度更是达到了50%以上。而RTX 4070 Ti相较于七彩虹iGame GeForce RTX 4070 Ultra W V2,在核心数量方面有天然的优势,因此在测试1440p分辨率下领先后者30%左右。
也就是说,即便是不利用DLSS 3这一黑科技,七彩虹iGame GeForce RTX 4070 Ultra W V2便以完全超越了上一代的中高端显卡。那么在加入DLSS 3之后,七彩虹iGame GeForce RTX 4070 Ultra W V2的帧率表现还会有多大的提升呢?
DLSS 2/3对比性能测试
通过Frame Generation帧生成功能,DLSS 3不仅能够让游戏帧率在DLSS 2的基础之上得到进一步提升,同时它还进一步确保了游戏画质,让玩家不必通过牺牲画质的方式来提升帧率,这便使得许多原本只能运行1440p游戏的显卡,可以尝试4K分辨率下的游戏体验,这在我们此前的评测中,均有体现,引入了DLSS 3黑科技的七彩虹iGame GeForce RTX 4070 Ultra W V2同样具备这样的能力。
在同等级设置的DLSS模式下,1080p游戏环境下DLSS 3的实际帧率表现相比原生帧率提升幅度在66%~264%,平均提升幅度约为130%,将画面分辨率提升至1440p之后,DLSS 3的实际帧率表现相比原生帧率的平均提升有所提高,达到了152%左右。以新游戏《霍格沃兹之遗》为例,在开启DLSS 3的情况下,七彩虹iGame GeForce RTX 4070 Ultra W V2分别在1080p分辨率、1440p分辨率下分别得到了150fps、113fps,而在开启DLSS 2的情况下仅有100fps、77fps,也就是说借助DLSS 3,七彩虹iGame GeForce RTX 4070 Ultra W V2确实还能在DLSS 2的基础之上得到进一步的帧率提升。综合我们本次测试,不难看出,在利用好DLSS 3之后,玩家完全可以通过七彩虹iGame GeForce RTX 4070 Ultra W V2搭配一款高刷新率显示器,在1440p分辨率下体验到诸如《赛博朋克2077》《霍格沃兹之遗》《杀手3》等超顺滑的3A大作。
PCL、1%L fps测试
目前许多游戏玩家十分在意游戏之中存在的系统延迟,特别是在低帧率情况下,超高的系统延迟甚至能够直接对游戏操作带来明显的影响,有鉴于此DLSS 3特别集成了NVIDIA Reflex功能,从而能够帮助玩家得到优异的游戏体验。
通过Frameview记录相关数据,我们可以发现,七彩虹iGame GeForce RTX 4070 Ultra W V2在开启DLSS 3之后,能够大幅度降低系统延迟,以新游戏《原子之心》为例,在开启DLSS 3的情况下,1440p分辨率下系统延迟从49ms降低至26ms,1080p分辨率下系统延迟从33ms降低至24ms。另外,随着游戏帧率的提升,游戏的1%L fps也会有所提升,同样以《原子之心》为例,在开启DLSS 3的情况下,1440p分辨率下1%L fps从79提升至143。同时,本次测试的所有游戏均有这样的趋势变化,也就是说当游戏画面分辨率越低、帧率越高时,系统延迟的降低效率也就越好、1%L fps也会更高,玩家除了可以感受到更流畅的画面,游戏操作也能更为连贯、顺手,从而打出更优异的游戏表现。
Studio创作性能测试
Ada Lovelace与RTX 40系显卡除了面对游戏玩家带来了“一大票”福利之外,还针对创作者以及NVIDIA Studio方面进行了更深度的优化,从而能够显著提升生产力。为此,我们还加入了诸如davinci resolve 18、Blender Opendata、Blender 3.5等多款软件对七彩虹iGame GeForce RTX 4070 Ultra W V2进行创作性能方面的测试。根据实际的测试结果来看,在Blender Opendata的Monster、Junkshop、classroom三项测试中,七彩虹iGame GeForce RTX 4070 Ultra W V2分别得到了3106、1524、1509分,而RTX 3070分别得到了1787、1107、963分,RTX 3070 Ti分别得到了1953、1202、1003分,优势肉眼可见。而在视频转码、图像处理等应用中,七彩虹iGame GeForce RTX 4070 Ultra W V2同样拥有RTX 3070与RTX 3070 Ti难以企及的优势,因此有需要购入新显卡的用户完全可以忘掉已经跟不上时代的后者。
Stable Diffusion AI图片生成计算
最近这段时间,应该许多读者在各大网络平台都已看见许多精美的水墨画、油画、赛博朋克风格画,这些画作中绝大部分并非人工制成,而是通过AI绘画生成而来,而 Stable-Diffusion便是其中一种AI绘画工具——它具备操作简单、出图快的特点,并且可以根据关键词进行检索、打磨、绘制,带来新颖的体验,因此目前受到了广大网友的喜爱。为此,我们在测试中加入了Stable Diffusion AI图片生成计算,并输入相同的关键词,等待出图结果。根据实际测试,我们可以看到七彩虹iGame GeForce RTX 4070 Ultra W V2在本次测试中具备最出色的表现,无论是耗时时长还是渲染效率,都远非RTX 3070 Ti以及RTX 3070可以媲美的,而处理器在应对这类需要时则更显乏力。因此,对于有AI制图需要的用户而言,七彩虹iGame GeForce RTX 4070 Ultra W V2也会是一个具备高性价比的选择。
看片更清晰,RTX VSR
早在一个月前,NVIDIA就在当时的驱动中上线了RTX Video Super Resolution功能,简称RTX VSR。它旨在提升在线播放视频时候的清晰度,帮助大家提升浏览视频时的体验。RTX VSR 可减少或消除因压缩视频而产生的伪影,如块效应、边缘的振铃伪影、高频细节的消失和平坦区域的带状现象,减少纹理损失、锐化边缘和丰富细节。同时,该技术能够使用深度学习网络,在单次推理中进行图像放大和减少压缩伪影,并分析低分辨率的视频帧、预测目标分辨率下的残差图像。然后,将残差图像叠加到传统的图像增强上,纠正伪影错误并锐化边缘以匹配输出分辨率,完成整个过程之后进而提升画面清晰度。
目前要实现RTX VSR需要两个硬性条件,其一是必须基于RTX 30系以上的GPU并得到驱动程序的支持,其二则是需要支持RTX VSR功能的浏览器或播放器(目前支持VSR技术的浏览器主要是最新版的Chrome和Edge)。而我们通过使用浏览器以及播放器两种方式,体验了RTX VSR。从实际表现来看,RTX VSR确实能够让在线视频更为清晰,特别是在细节处的处理上更为精细,这便使得原本会糊成一团的图案轮廓更为分明,用户在播放视频时能够感受到更多的画面细节。
在使用RTX VSR功能之前,用户需要打开NIVIDA控制面板,选择调整视频图像设置,并在其中勾选RTX视频增强选项下的“超分辨率”(框选的内容),就能在支持VSR功能的浏览器中开启RTX 视频增强。
▲从对比视频的框选处,我们可以看到基于RTX VSR功能的视频播放确实在处理细节方面有着更精细的表现,特别是暗处的字样轮廓更清晰,而不是糊成一团。
散热、超频测试
根据拆解后的PCB板,我们可以发现七彩虹iGame GeForce RTX 4070 Ultra W V2不仅预留了足够的空间,显得颇为干净、简约,同时它的元件焊点饱满,做工值得肯定,散热结构也花费了不少心思,因此我们并不担心这款显卡在散热、超频环节的测试。最近环境温度有所回升,在室温25℃的情况下,七彩虹iGame GeForce RTX 4070 Ultra W V2的待机核心温度仅为29℃,值得肯定;当我们对其进行进行长达半小时的Furmark烤机测试之后,其核心温度最终维持在59℃左右,散热表现非常出色,这个时候其背板用手触摸也仅感温热。功耗方面,通过记录,我们发现它在1440p游戏环境下的最大功耗为187W、1080p游戏环境下最大功耗为171W、烤机时最大功耗为208W,较RTX 3070有所明显,能效比提升显著。
▲iGame Center软件可以帮助我们监控硬件性能、调整显卡背光以及进行手动超频。
▲从GPU-Z上可以看到,我们将七彩虹iGame GeForce RTX 4070 Ultra W V2的核心Boost频率稳定到了2670MHz。
▲在超频状态下,七彩虹iGame GeForce RTX 4070 Ultra W V2完成了3DMark Time spy Extreme的测试,并得到8939的显卡分数。
随后,我们通过iGame Center软件对七彩虹iGame GeForce RTX 4070 Ultra W V2进行手动超频,希望进一步探究它的极限性能。在多次尝试之后,七彩虹iGame GeForce RTX 4070 Ultra W V2的核心bosst频率最终稳定在2670MHz,较超频前多出了195MHz。同时,在这样的状态下,七彩虹iGame GeForce RTX 4070 Ultra W V2成功完成3DMark Time spy Extreme的测试,且显卡得分达到了8939,较超频有所提升,因此该显卡也有一定的超频空间。
小结
波普风格设计为七彩虹iGame GeForce RTX 4070 Ultra W V2带来了充分的活力以及明亮阳光的观感,让人免不得多看上几眼。而在Ada Lovelace与其新特性、新功能的帮助下,这款显卡则展现出了全方位碾压上代产品的实力水准,传统游戏性能领先RTX 3070 Ti约20%,领先RTX 3070近30%。在开启DLSS 3之后,相对于只支持DLSS 2的RTX 3070 Ti在性能上近乎领先达75%,可以说彻底拉开了与前一代产品的差距。
无论是游戏方面还是生产力创作方面,iGame GeForce RTX 4070 Ultra W V2皆有着更优异的表现。除此之外,在后续的散热测试与超频测试方面,七彩虹iGame GeForce RTX 4070 Ultra W V2也没有让人失望——低于60℃的烤机核心温度以及较默认状态下超出195MHz的超频boost频率,均体现出它在散热与用料上的用心。最最最关键的是,这款产品是作为MSRP(与官方首发指导价一致)面世的,可以说是给玩家们的一大福利了,“颜艺”双修的它自然也是玩家们非常值得考虑的对象,尤其是对于万元左右的装机方案来说,它实在是物有所值。
关键词: