显卡,游戏

2K 100FPS+光追显卡,NVIDIA GeForce RTX 4070 FE首发评测


2K 100FPS+光追显卡,NVIDIA GeForce RTX 4070 FE首发评测

2023年4月12号,NVIDIA正式对外发布Ada Lovelace核心架构的新产品 — — NVIDIA GeForce RTX 4070。与GeForce RTX 4070 Ti一样,GeForce RTX 4070采用AD104核心、12GB GDDR6X显存与192Bit位宽显存,但其功耗却控制在200W,性能表现是否仍是与我们预期中的那样强?我们一起来了解下。

NVIDIA是如何定位AD104此两款显卡的?GeForce RTX 4070 Ti针对的是2K游戏下120+FPS;而GeForce RTX 4070同样是2K游戏显卡的定位,但是针对的是更细分的100+FPS市场。

这时候肯定会有人说,有必要这么细分市场吗?答案是真有必要,自从NVIDIA显卡发展到GeForce RTX 40系列显卡开始,Ada Lovelace核心架构已经有着不太一样的变化,玩家眼里可能就是那么几十FPS值的差别,但是RTX 40系列显卡能做的不再只是游戏这一选项,包括目前流行的AV1编码解码、针对AI运算提升,以及专业内容的创造这一系列的改变都在影响着未来显卡发展走向。

最直接的差别就是GeForce RTX 4070显卡的零售报价直接来到了4799元,更低的价格可以体验到更强的性能,这时候你还觉得没必要吗?

 在GeForce RTX 4070 Ti首发当时我们就已经提及到,AD104是一个小型的核心,里面包括了5个GPC (图形处理集群)、30 个TPC (纹理处理集群)、60 个SM (流式多处理器) 、带有 6 个 32Bit显存控制器的 256 Bit显存位宽,以及四个NVENC和两个NVDEC。其中GeForce RTX 4070 Ti已经是采用较为完整的AD104核心,仅是在NVENC与NVDEC上进行的削减,因此其规格也是比较有看头的。

但这次GeForce RTX 4070针对更细化的2K 100FPS+市场,于是剪刀手老黄对AD104核心来了一刀恨的,整个GPC单元就直接给没掉,包括NVENC编码器也只留下一个,当然这样也是不会影响支持AV1格式的编码与解码的,就是效率高低与否的问题。

我们再认真看GeForce RTX 4070显卡的规格:4个GPC (图形处理集群)、24 个TPC (纹理处理集群)、48 个SM (流式多处理器) 、?个带有 6 个 32Bit显存控制器的 192 Bit显存位宽GDDR6X显存控制器,以及1个NVENC和1个NVDEC。

规格上来看,性能似乎与GeForce RTX 4070 Ti会拉开不少差距,但对若是拿上一代的RTX 3070/3070 Ti规格来对比,核心面积更小巧,规格也相当的情况下TDP功耗却更低。至于GeForce RTX 4070最终会是怎么样的表现,我们接着看。

GeForce RTX 4070 FE产品外观

这次NVIDIA提供了两个不同的NDA时候,4月12号也就是今天,解禁的是NVIDIA GeForce RTX 4070 FE公版显卡,以及AIC的标准频率版GeForce RTX 4070产品;4月13号解禁的是超频版的GeForce RTX 4070产品。

这里我们优先拿到了NVIDIA提供的GeForce RTX 4070 FE公版显卡。从外包装上来看,GeForce RTX 4070 FE显卡与之前的GeForce RTX 4080 FE | GeForce RTX 4090 FE 采用同样的外包装设计。

GeForce RTX 4070 FE显卡固定在定制的内卡槽上

而且这次GeForce RTX 4070 FE显卡真给我们带来了惊喜,体积小巧了许多许多。

从左往右分别是GeForce RTX 2070 SUPER、GeForce RTX 3070 FE、GeForce RTX 3070 Ti FE、GeForce RTX 4070 FE、GeForce RTX 4080 FE、GeForce RTX 4090 FE。几块不同的公版你就看到什么叫惊喜了吧,GeForce RTX 4070 FE显卡摆脱了RTX 40系列给我们的“巨大”的印象,是几款对比显卡中最为小巧的一款。

多另外一个角度来看,更直观感受到GeForce RTX 4070 FE显卡的小巧。根据笔者手工测量245*40*100mm的规格来看,这卡直接安装到A4等小巧的ITX机器里完全是没有问题。

GeForce RTX 4070 FE显卡整个外观设计延续了RTX 40系列FE显卡的整体风格。

先不管这样的设计是否有着更高效的散热效果,但是单从设计来看,的确是比较好看。当然也会有玩家说,RTX 20的双火炉设计才是他们的真爱,只能说各花入各眼。至于体积缩小这么多后是否会带来另外的散热问题,我们之后会对此进行较为详细的测试。

输出接口方面,仍然昰老配方:3个DP1.4+1个HDMI2.1的设计,可以实现3+1屏联屏输出。笔者这里建议大家使用顶部的第一个DP接口来连接显示器。

正反两把风扇的设计是目前NVIDIA FE公版显卡中较为常用的散热设计方案,可以在机箱内部形成独有的风道,加快热量的排出。

尾部的是反向风扇,看叶片就应该能了解到这风扇是排出的设计。

而至于辅助供电方面,这次GeForce RTX 4070 FE显卡同样采用了12VHPWR 16Pin供电的设计,FE公版赠送了一条12VHPWR 16Pin转双8Pin供电线,这样可以方便大家使用。同时NVIDIA官方建议搭配GeForce RTX 4070 FE显卡的为650W额定功耗的电源。

GeForce RTX 4070 FE产品拆解

GeForce RTX 4070 FE显卡的拆解是从背部开始,背板其实有是两层,一层是金属装饰板,另外一个是固定PCB的金属背板。

尾部开始,这部分比较好拆,直接拉起来就可以了,因为这部分是利用三颗磁铁来做固定的。

靠近IO装饰的背板你会发现被卡住了,拆不下来,别担心,IO挡板位置有个小孔,直接怼一下,整个金属装饰板就会下来。

无损的把装饰背板给拆下来。

FE公版显卡的做工、细节还是如此的细致

金属背板是利用6颗T型头螺丝固定的

6颗螺丝给拆掉就可以了,注意一下金属背板的导热垫。

要想把PCB给拆下来,就得把IO挡板的四颗螺丝也得给去掉。

GeForce RTX 4070 FE显卡显卡就拆得干干净净了,可看到PCB的比较小巧,集成度其实也较高。

中框是一个体成型的铝合金框架,把显卡的散热器主体给固定住。

配上这个图大家就可以看到散热器是怎么和铝合金框架扣在一起的了

三个小卡扣就能直接把散热器给扣住

散热器下面是大面积的散热鳍片

从散热器的规模来看,GeForce RTX 4070 FE显卡算是正常的,只能说这样的体积搭配这样的规格也真可以了。相信想要散热效果更好的自然会购买AIC的非公版产品。

GPU位置是纯铜底座,底部分经常铣削处理,比较平滑;散热器四周都经过了黑化的处理,这样散热器的抗氧化性能更高;同时显卡和供电部分都配上了导热垫辅助散热。

GeForce RTX 4070 FE显卡的板型编号是PG141,大家可以从GPU-Z或者是PCB背部能找到板型编号。而目前大部分的非公GeForce RTX 4070显卡将会基于此PG141板型进行优化处理,值得注意的是,由于采用的同样是AD104核心,所以部分AIC超频产品会是直接套用RTX 4070 Ti非公版的方案。

从PCB上我们就可看到PG141方案其实可以支持更高规格的供电,只是目前GeForce RTX 4070 FE显卡需要5+2+1相的供电规格即可满足,没必要过分的堆料。

GeForce RTX 4070 FE显卡核心编号为AD104-250,可能此款核心是较早生产的(22年31周),核心编号并没有印到上面去。但我们拆解别的GeForce RTX 4070显卡已经带上核心编号,生产周期为22年51周。

左侧是传统的核心供电部分5相供电,均采用的LR22贴片电感与固态电容。

MOSFET部分为NCP家出的302150 DrMos芯片,内建了上下两桥与驱动IC,持续最大输出电流可达到50A。

PCB背部右上角是核心供电PWM芯片,UPI uP9512R芯片。

显存供电芯片,u55650Q。

标准化的12VHPWER供电母口,其实对于TDP仅为200W的显卡来说,单8Pin即可以满足,所以大家会在市面上看到单8Pin的GeForce RTX 4070非公版显卡。但是对于主推PCIe5.0供电规范的NVIDIA来说,未来将会是12VHPWER的天下。

测试平台介绍

测试平台方面,我们同样采用的是INTEL目前桌面级最强的处理器Intel i9-13900KS,主板配上ROG MAXIMUS Z790 HERO,并在主板BIOS中开启了Resize BAR(Resizable BAR)功能,确保我们在搭配RTX 40系列显卡后可以正常开启DLSS3技术。

至于显卡测试的对手方面,我们这里挑选了几款NVIDIA显卡一同进行对比,包括:初代的中高端光线追踪游戏显卡GeForce RTX 2070 SUPER、第二代中高端光线追踪游戏显卡GeForce RTX 3070 FE与GeForce RTX 3070 Ti FE,以及GeForce RTX 4080 Ti显卡。

显示器方面自然是评测室专用的电竞神器——爱攻&保时捷联名 PD32M 4K144 电竞显示器。

驱动方面我们采用的是NVIDIA官方提供的测试版本驱动,确保所有的显卡都不会因为驱动版本不一而做成的性能影响。

测试电源介绍:

这个就是GeForce RTX 4070 FE显卡配送的12VHPWR转双8Pin辅助供电转换线

搭配上转换上,能使用,毕竟此款显卡的TDP仅就200W左右。类似笔者这种经常需要更换显卡的,或者是爱折腾的玩家,建议你还是直接购买支持ATX3.0\PCIe5.0规范的电源。

12VHPWR直连的供电线有300W与450W,以及最强的600W版本,针对GeForce RTX 4070用上300W标准的线即可。若你是需要定制线材的,那么笔者还是建议你直接定制600W标准规格级别以上的线材更好,后期升级显卡就一步到位了。

相对来说,直接的效果还是相对较好的。

理论性能测试

从RTX 20开始,NVIDIA就已经把光线追踪技术加入到最新的桌面级游戏显卡中,到现在的RTX 40系列历经三代产品的演变,显卡光线追踪性能得到了较为大幅度提升。

从3DMARK的理论性能来看,GeForce RTX 4070 FE显卡跑分真不错,在削减了整组GPC后,理论性能比大哥GeForce RTX 4070 Ti落后大概21%左右。若是我们拿GeForce RTX 4070 FE显卡与上代的RTX 3070 FE显卡来对比,新一代的显卡约领先29%,更不说大幅度领先GeForce RTX 2070 SUPER FE显卡。

AIDA64 GPGPU测试可以反应出不同架构显卡下算力的情况,可看到此代RTX 40系列显卡ADA架构的确让显卡有着更出色的运算能力,无论是单精度运算还双精度运算,其同样是大幅度的领先。

游戏性能测试

游戏性能测试方面我们这里挑选的是一些较劲为流行的3A游戏大作,当然大部分都是支持DLSS技术,但我们会把帧生成给关掉,后文中我们会详细的测试DLSS3游戏性能。

GeForce RTX 4070 FE显卡游戏性能提升仍是比较理想的,领先上代GeForce RTX 3070 FE显卡约26%;尤其是随着分辨率的提升,部分光线追踪能力要求更高的游戏提升就越为明显。

而与老哥GeForce RTX 4070 Ti显卡对比,性能差距并没有3DMARK理论性能那样的大,大概就是16%~19%左右;结合1K5零售差价来看,GeForce RTX 4070 FE显卡的性价比似乎还真的是更高了哦。

DLSS3游戏性能测试

我们都知道RTX 40系列显卡最猛的技术就是DLSS3,帧生成的加入,让我们能够体验到更为流畅的游戏表现。从3DMARK DLSS3理论性能来看,这四款显卡定位是真准,基本就是按照NVIDIA官方给出的定位来打造一样。

在开启DLSS3的帧数生成后,游戏的延迟数值会有明显的增加,但这个不是影响游戏流畅度的数值,最终影响游戏性能的仍是显卡的硬实力,显卡性能足够的强了,那么FPS就会更高,相对就提升的那十多ms延迟也就影响不大了。

说真的之前我们测试其它的RTX 40显卡就已经知道DLSS3性能提升是相当大的,来到GeForce RTX 4070 FE显卡性能提升猛得也不是一点点,相比上代显卡直接就是70%性能的提升。

对于1080p玩家,其实RTX 3070也能玩玩,但来到2K游戏时代,旧显卡还真玩不动,尤其是部分游戏在开启光线追踪与DLSS后,对显存的依赖性更高,会出现爆显存的情况。而GeForce RTX 4070 FE显卡就没有这个问题,配的是12GB显存,大部分游戏流畅度都高得很,而且2K分辨率DLSS3游戏提升更为明显,直接就是提升135%帧数提升,真的有点猛。

虽然是定位2K 100+FPS游戏级别的显卡,但GeForce RTX 4070 FE仍是具备一定的4K游戏能力,只要把DLSS3一开,或者是把游戏画质降低一些,游戏流畅度就直接上来了,跑个60+FPS不成问题。

平面&专业内容创作测试

之前笔者都已经说过,最新的RTX 40系列不再局限于游戏显卡的定位,多项技术的加持下可以进一步提升我们的办公效率。在平面内容方面,我们这里测试了PCMARK10、UL Procyon全家桶,PugetBench For ADOBE全家桶,以及PugetBench For DaVinci;全部都采用了最新的正式版软件,但不排除部分软件与驱动存在优化的问题,所以往后我们的测试中会不断的更新软件,测试脚本,以及最终的测试数据。

PCMARK10我们直接来一个要求更高的Extened测试,同一个平台的情况下,常用基本功能分数基本会在同一个基准线上,不同显卡最大的区别就体现在生产力、数位内容创作,以及游戏方面。最强的自然是老哥GeForce RTX 4070 Ti,而GeForce RTX 4070 FE除了在游戏方面拉开差距外,其它的两项数据领先的并不多。

而我们再来看看视觉平面方面的数据情况,在PugetBench For ADOBE全家桶的中,GeForce RTX 4070 FE并没有拉开性能差距,这部分笔者认为是优化原因居多。而我们使用上最新版本的DaVinci 18.1.4软件来测试后,ADA架构显卡的视频处理能力明显有着提升。

自RTX 40系列显卡发布之后,NVIDIA的专业内容性能进一步的提升了,同档次显卡明显有着50%性能的提升,若你有专业内容创作需求的,这里真心推荐购买RTX 40系列显卡。而GeForce RTX 4070 FE与GeForce RTX 4070 Ti的专业性能差距就在14.4%,大家看着预算办事好了。

NVIDIA AV1测评

AV1编码解码器也是NVIDIA在RTX 40系列显卡中独有的,而由于GeForce RTX 4070 FE只保留了一个编码器与一个解码器,所以在H.265 4K30视频输出时间上并不太理想,但H.265 8K30视频输出上就省了很多时间,当然AV1也是相对的会耗时一些。

AI性能测试

AI性能测试,我们这里分了三部分,首先是DaVinci的AI ACCELERATED MAGIC MASK,这个我们在RTX 40系列显卡的首发都有做到,但是随着DaVinci版本的提升,AI能力也随之有着不一样的变化。目前来看,GeForce RTX 4070 FE显卡只落后了GeForce RTX 4070 Ti 2秒处理的时候,而比上代的GeForce RTX 3070处理时间就快了7秒之多。要知道这仅是单纯的一个特效,若是更为复杂的工程文件,那AI处理能力将会是飞一般的提升。

第二部分同样的我们之前也会测试到的ON1 Resize AI 2023图片处理,将我们测试软件直接扩展到200%后算出最终平均每张图片的处理时间,GeForce RTX 4070 FE显卡就是快了一点点。

第三部分是最新的Stable Diffusion Automatic1111 WebUI,也就是目前较为流行的AI生成图片能力测试,生成20张768*768px分辨率的房子算不同GPU每分钟处理的图片数量。这里同样是RTX 40系列的天下,另外8G显存已经很难满足于Automatic1111 AI运算需要了,大家想玩的还是直接12GB显存版本的显卡起步吧。

NVIDIA RTX VSR性能测试

一直以来NVIDIA在DLSS技术的发展上都是比AMD与INTEL都要领先得多的,尤其是RTX 40系列显卡独有的DLSS3技术,会为我们带来更流畅的游戏体验。而最近NVIDIA还弄了个大招 — — RTX VSR,即RTX  Video Super Resolution,也就是驱动面板中可看到的 视频超分辨率选项。

根据NVIDIA的说法,RTX VSR是一种AI图像放大处理技术,技术基于AI人工智能、RTX Tensor张量核心硬件单元,智能锐化和强化特征和边缘,同时消除恼人的压缩伪影。而正因为RTX VSR依赖RTX Tensor张量核心,所以目前仅支持RTX 30系列、RTX 40系列显卡。

而你想RTX VSR技术,确保显卡支持的情况下,你还得使用上支持此款技术的最新显卡驱动,最新的Chrome、Edge浏览器,或者是首款支持此RTX VSR技术的VLC软件。目前RTX  VSR提供了1~4四种不同档位视频质量级别的供大家选择,其中最理想的自然是4档,但是相对应的GPU占用率就会高些。

这里我们测试的视频是直接利用EDGE播放某动画片,OBS软件内录视频后,利用ICAT软件进行视频与画质的对比。在暗部表现同样如此,原视频里地板如同劣质贴图,有VSR加持后每块砖头都清晰可见,且立体感满满,尤其是旁边绿色植被的清晰度更高了一个数量级。除此之外,RTX VSR技术的AI算法似乎还能够通过类似DLSS帧生成的方式计算出物体的远近关系优化景深效果,这一点同样能够使得画面整体观感得到提升。

这里我们也给大家准备了对比视频,从视频里就可以看到VSR的效果之明显,最高级别的VSR 4跟原生480P相比就是一眼的区别,在开启RTX VSR技术后,部分图像质量有了显著提高,不仅锯齿和噪点几乎全部消失,颜色过渡也更为平滑,目前VSR能有这种表现堪称惊艳。

进一下测试一下本地视频播放软件,VLC是目前首个支持RTX VSR技术的本地播放器,且能够支持多种视频格式播放。正式版也随着RTX 4070显卡的解禁上线了,你硬盘里的老视频也能摇身一变成1080P了!

我们将浏览器中的视频与本地的视频同时进行RTX VSR 4档渲染,从画面上看,右侧本地播放器的效果要弱于左侧浏览器的,浏览器上的4档VSR线条更锐利,画质也更清晰,不过即使是本地播放器的效果也要远强于原生480P,笔者猜测可能是目前本地浏览器的优化还不到位。

我们也将原生480P与浏览器和本地播放器上的VSR渲染视频进行对比,从视频画面中可以看到,本地播放器上4档VSR渲染过后,文字或线条都相比原生480P有一定提升,至少以前模糊不清的视频可以看了,不过对比浏览器的效果还略有差距,后者的效果已经接近原生1080P了。 

总的来说,RTX  VSR功能是比较实用的,目前就是对显卡门槛有一定的要求,若是RTX 20系列显卡也能很好的支持,那么这技术就真的更理想了。

温度与功耗测试

相信大部分的玩家都比较关心GeForce RTX 4070 FE显卡发热与功耗的问题,毕竟此款显卡的仅是双槽的设计,远比之前的RTX 40系列显卡小多了。

Furmark烧机20分钟后,GeForce RTX 4070 FE显卡最终温度稳定在66.6度,热点温度为79度,显存温度为64度,风扇转速约为1700rpm,噪音主观认为有点一米外可忽略。此时显卡的最大功率为194.5W,12VHPWR供电功率为181W。

相较几款横向对比的显卡,在Furmark烤机方面,此款GeForce RTX 4070 FE显卡的功耗还真是相较低的。同时可看到RTX 40系列显卡转变成12VHPWR辅助供电后,整块显卡的供电基本就是依赖此接口,PCIe供电辅助都较低。

Furmark只能说明显卡在重度负载的情况下功耗表现,那么我们再利用HWINFO与FrameView软件对显卡对行功耗的监控。从不同的应用软件来看,GeForce RTX 4070 FE显卡功耗表现基本都是控制在TDP 200W以内,相较更高级别的显卡的确是有着更好的功耗表现。

而相比上一代的产品,GeForce RTX 4070 FE显卡的每瓦性能表现有着再进一步的提升,同为TDP 200W左右的显卡,却带来了150%性能的增长,着实不错。

总结:2K 100+FPS游戏利器

此款GeForce RTX 4070 FE,笔者是比较喜欢的,不单是因为其有着较为小巧的体积,供电要求低,更因为同功耗的情况下能够提升更为出色的性能表现。对于想组高性能、小巧游戏主机的玩家来说,此款显卡是最佳的选择。

对于游戏玩家来说,GeForce RTX 4070在开启DLSS3之后,2K 100+FPS大部分的3A游戏还真完全没有压力,甚至是部分高要求的光线追踪游戏都可以满足。而即使不支持DLSS的游戏,GeForce RTX 4070仍是能提供约126%性能于上代RTX 3070显卡,这已经很是不错的表现。而且越来越多的游戏也支持上DLSS3技术,想花更少钱体验更游戏体验,也只能挑选GeForce RTX 40系列显卡。

若大家想初步的玩AI运算或者组建小型AI服务器,GeForce RTX 4070的确是把入门门槛进一步拉低了,GeForce RTX 4070在显存容量和算力方面都是目前较为适合的。

最后,对于MSRP零售报价来说,GeForce RTX 4070 FE与AIC标准版本的GeForce RTX 4070显卡是4799元。可能会有一定的存疑,是不是贵了?但是从目前的RTX 40系列的显卡定价来说,这算是比较低开的零售报价,这功耗与性能提升,配合上价格,性价比真不错,可以说GeForce RTX 4070是目前万元装机的首选显卡。