自从NVIDIA 老黄在9/21 举开的GTC 2022 大会上正式揭开最新一代采用 Ada Lovelace 架构的GeForce RTX 40 系列开始,显示卡世代王者的宝座就已经正式易手,相信许多玩家已经都摩拳擦掌的等着新版本正式上市后可以赶快入手把玩、并体验一下强大的效能表现吧!
官方也将于10/12 后正式开卖,相信几大网路商城都已经蓄势待发的准备开始发售了,官方报价1,599 美元预计开卖价会落在新台币5 万5 ~ 6 万5 之间(看各家版本),如果觉得稍贵想等低一阶的RTX 4080 系列可能要忍耐到11 月啰!
下面就跟着小编视角,来瞧瞧这款号称新一代显示卡之王的NVIDIA GeForce RTX 4090 到底有哪些过人之处可以称王吧!
迈入4N制程的Ada Lovelace架构、超高CUDA数与第4代Tensor Core/第3代光追核心
在历经了超长一段时间的各种小道消息与各项测试数据的泄漏之后,终于NVIDIA 的新世代显示卡RTX 4090 FE 来到正式的效能解禁时刻啰!
身为老黄为玩家准备的年度「重量级」(各种意义上XD) 产品,不仅是象征着新一代游戏体验的标竿,同时也是NVIDIA 试图拯救近期显示卡销售疲软的重要手段,究竟新世代卡皇登基是否会重燃玩家们换换症的欲望,又或是反而凸显上一代RTX 3090 变得真香呢?
以下就来揭晓吧!首先,先来基本规格复习一下:
RTX 40 系列晶片换上新的Ada Lovelace 架构,产品制程也从三星的8nm 换成了订制版的台积电5nm,还因为官方将其命名为「4N」恰巧和台积电的4nm 制程撞名,从而引发了不少的讨论和误会,也让官方在事后的媒体问答上特地跳出来澄清。
▲完整的AD102 GPU架构
而随着制程的进步,RTX 40 的晶片自然也就能塞入更多的电晶体,运算核心的数量也跟着向上暴增,像是最高阶的RTX 4090 在CUDA 数量上就来到了16,384 个,比前代RTX 3090 的10,496 个、RTX 3090 Ti 的10,752个高出约35%。
更甚者,RTX 4090 直接把NVIDIA Encoder (NVENC) 多媒体转档核心的数量翻倍,让RTX 4090 显示卡在处理H.265、AV1 编码的影片效率可以比RTX 3090 Ti 高出一倍之多!让创作者能够实现高度有感的创作效率提升。
此外,Ada Lovelace 架构也对NVIDIA 近年主打ML 机械学习、AI 功能进行强化,带来了第4 代Tensor Core 机械学习核心和第三代光线追踪核心,大幅度增加在3D 模型建模、光线烘焙等运算效率,例如在Blender 中,RTX 4090 的运算速度就比RTX 3090 Ti 高出60%、V-Ray 更是提升达90% 之多。
不光如此,NVIDIA 也持续让AI 能够应用在更多元的领域,为热爱直播分享的玩家带来全新的「AI 直播画质增强技术」,未来玩家使用OBS、Discord 进行直播的时候,只要将录影格式改为AV1,在上传流量不变的前提下,能够透过显示卡的AI 运算提供更为清晰的画质,让大家在观看实况的时候,减低游戏过程遇到大乱斗画面就糊成马赛克的窘况。
至于游戏方面,老黄这一次不再把8K 解析度娱乐做为RTX 4090 的主打卖点(卡片连DP 2.0 都没支援…),取而代之的是将重点放到了玩家更为注重的FPS 值的提升上,为RTX 40 带来「专属」的DLSS 3 技术。(小编认为根本就是对呛A 家的FSR 2.0…)
▲DLSS 2
DLSS 3 技术透过晶片中重新设计的「光流加速器(Optical Flow Accelerator)」,让显示卡具备了了像素等级的「方向感知」能力,能够分析每个游戏画面中的物件移动方向,从而得以追踪每个游戏物件之间的连续变化关系,使光影、动态的表现更为连贯。
▲DLSS 3
与此同时,DLSS 3 持续利用深度学习DL 的特色,将前、后生成的游戏画面、游戏引擎的动态向量(Motion Vector) 以及光流加速器追踪的结果进行整合,帮助显示卡能够还原出更多的内容。
最终,DLSS 3 实现了在两个原始画面中,插入「AI 合成画面」的能力,官方将其称为「Ray Tracing: Overdrive (RT Overdrive)」。根据官方的说法,DLSS 3 能够重建7/8 的像素内容,也就是原始为1080P 解析度的原始内容在DLSS 3 加持下提升到4K 解析度的话,AI 不仅会帮忙放大的画面之外,还会再送上一张画面来衔接后面的内容!
透过DLSS 3 技术,官方表示多数游戏的FPS 值的提升将会是从翻倍起跳,部分游戏如《电驭叛客2077》的提升幅度更是达到400%!(好…厉…害…啊~
然而由于DLSS 3 需要依赖RTX 40 晶片中新设计的「光流加速器(Optical Flow Accelerator)」,使得RT Overdrive 功能有着硬体方面的限制,成为了RTX 40 系列的独占功能,一定程度上也可能成为老黄想要大家换卡的最大诱因XD。
▲目前已有超过35款游戏和App支援DLSS 3
既然RTX 40 系列在制程、核心数量都有大幅进化,还有DLSS 3 的加持,那当然要实际上机跑跑看才算数啰!所以接下来就让我们来见证年度卡皇RTX 4090 FE 的威力吧!而在上机之前,就先来检视一下这片新一代卡皇的独特风貌。
开箱
基本上每一代官方原厂都有推出Founders Edition 创始版(FE),但这次收到的媒体测试特别版真的就”蛮大”一组的,有别于先前的设计改采了犹如展示设计的彩盒包装,只能说如果正式发售的时候也是这样的版本,那就很具收藏价值,有预算的朋友推荐入手一组,不仅可以自用、应该还有保值的意义。
看过了前面提到的诸多RTX 40 系列的特色后,那就来瞧瞧这款期待已久的首波主打:GeForce RTX 4090 FE 真面目吧!
呵,虽然主图已经都放了,但既然要开箱、那还是要从小编收到的原包装开始看起;如果不说这箱子里面放的是最新的RTX 4090 FE,肯定会以为只是个普通的纸箱,但仔细看一下两边可以发现有标注撕开的位置,那就大手一撕,开盒见真章。
▲光看纸盒外箱,肯定不知道里头放的是最新的NVIDIA GeForce RTX 4090 FE显示卡
撕开后一向上翻,除了看到有白纸覆盖上方之外,左右两侧还有箭头指示,请往左右掀开,然后翻开正面覆盖的白纸,就可以看到内盒的样貌,正上方的图样有没有熟悉的感觉XD~
从外箱抱出来的就是这一大盒标示GeForce RTX 4090 字样的黑色彩盒了,除了正面标示产品型号之外,背面底下也有规格标注,包括了盒内的物件除了RTX 4090 FE 本体之外,还有PCIe Gen5 电源转接线以及快速启用指南等。
那就准备开箱啰,不过左右还有黏贴封条,看起来想打开还得撕掉封条贴纸才行,开撕吧!
这次的创始版外盒设计的很特别(希望正式版贩售也是这样),撕开左右封条贴纸后就可以打开了,轻轻向上一掀,藏在其中的RTX 4090 FE 就展现在目光中了,彩盒另一半直接变成三角展示的背面,仪式感十足!
哇!有没有觉得根本就是展示品呢,虽然觉得很有架式,但想到这样的包装跟重量如果真的开卖时也是相同版本的话,恐怕售价得另加运费才划算;不过从本体的∞ 线条设计,也与之前RTX 30 系列具备同样元素,如果单看正面又把4090 遮掉的话,还真不好分辨咧!(是说那个数字的字体是怎么回事的不搭啊~)
取下RTX 4090 FE 本体后,彩盒底下还有藏着附件盒,取下附件盒打开就能看到随卡提供的12+4 pin 电源接头,还有就是快速安装指南之类的。
基本上新一代的RTX 40 系列都会采这样的连接方式,所以各家显示卡盒内应该都会附上这样的一条转接线,一边是连接显示卡上方的12+4 pin、另一边则是4×8 pin 设计的接头用以连接Power 提供的PCIe ATX 12V,要注意的是,这条专用的电源转接线有插拔次数的使用寿命,标准是30 次(没错、没看错),看来要嘛玩家插上后就不要随便拔来拔去、再不然就是有做为耗材使用的心理准备,否则插拔太多次后恐怕会无法使用。
下面就放几张RTX 4090 FE 的本体照供大家参考,按照插入主机板的设计来看,有标示RTX 4090 的这一面会在上方(在机壳内),如果裸机的话就是另一面在正面,上机后有两个位置会发光,本来以为不会亮灯了说!
另外,已经取消了NVLink 设计,所以未来也没有SLI 了,看看上方位置已经没有前代的NVLink 啰。(再塞一张RTX 4090 FE 可能会满出主机板边缘了XD)
创始版RTX 4090 采用的仍旧是双风扇设计,与前代的RTX 3090/3090 Ti 其实很类似,只不过架构与规格更先进的RTX 4090 光靠双风扇设计就能达到有效的散热吗?毕竟要解热450W?
这一点在实际上机运作时反而令小编感到惊艳,实际运作的噪音变小、散热性也不错,长时间运作下也还算OK,至少比起前代的感觉上没那么烫(哈~
尾部也做了一点点曲线设计,相较于前代四方感有些不同,不过从尾端的厚度应该不难发现到RTX 4090 FE 的厚度可是不低,官方标示厚度为61mm,小编实际测量也有达到60.75mm,一下子就占了超过3 个Slot 的宽度,看看新出炉的X670E/X670 跟Z790 主机板就知道,为什么在第一组PCIe 后面都设计成3 组的M.2 插槽了。
前端I/O 输出的部分则是配置了3 组的DisplayPort 以及1 组的HDMI,呼应刚刚提到的厚度,直接吃掉3 个Slot 以上,长度更是达到304mm,只能说想换RTX 4090 FE 的朋友请先确认一下手上的主机机壳深度是否足以放入,不然入手了装不进去还得连壳一起更换。
顺便来量一下重量好了,超过30 公分的这块 砖头 显示卡到底有多重呢?上磅秤可以发现重达2185.9g,接近2.2 公斤的重量,跟一台电竞笔电的重量也差不多,还好是装在主机里面,要是随身带着走、真的可以当杀人七武器之首了。(立马折凳要从第一名掉到第二名…、不爽就随时给你一板砖XD)
最后来欣赏一下朝天四炷香的英姿,这只能插拔30 次,使用时请小心,拔坏了请记得补充备品!
效能实测
为了发挥RTX 4090 FE 最大的效能威力,本次测试使用刚热腾腾推出不久的AMD Ryzen 9 7950X 处理器,并搭配支援AMD EXPO 标准的16GBx2 DDR5-6000 记忆体做为本次的平台,完整规格如下:
处理器:AMD Ryzen 9 7950X 主机板:GIGABYTE X670E AORUS MASTER 记忆体:G.Skill Trident Z5 Neo DDR5-6000 16GBx2(共32GB) SSD:Samsung 980 Pro 1TB PCIe 4.0 M.2 SSD 电源:InWin 1200W 作业系统:Windows 11 Pro 22H2
根据GPU-Z 的资讯,RTX 4090 FE 的核心基础时脉2235 MHz,爆发时脉为2520 MHz,记忆体与上一代RTX 3090、RTX 3090 Ti 一样为24GB 384-bit DDR6X。
首先看一下图形测试软体3DMARK 的基础跑分,在针对DX12 游戏内容的Time Spy 中,RTX 4090 FE 拿下了2.9 万分的高分,做为对比,RTX 3090 在3DMARK 天梯榜中分数则是落在近2 万分左右,可以看出RTX 4090 FE 在效能的进化上相当惊人。(提升1万分是…)
DX11 的Fire Strike 同样也是相当凶猛,RTX 4090 FE 的合计总分来到5.4 万分,其中GPU 的单独项目更是飙破7 万大关。
而在NVIDIA RTX 显卡家族拿手的Port Royal 光追测试中,RTX 4090 FE 的分数也来到惊人的2.5 万分,这个成绩究竟有多离谱呢?依照3DMARK 排行榜,Port Royal 的最高分纪录也才2 万出头,也就是说RTX 4090 FE 在光追的效能直接海放上一代20% 以上。
还没完呢!Port Royal 还有一个专门测试DLSS 的版本,由于正式版本的3DMARK 还没有加入DLSS 3 的支援,所以NVIDIA 官方另外提供了Beta 版本给小编进行测试。(正式开卖后应该就可以看到3DMARK更新了)
在开启DLSS 3、额外画面生成选项并将目标解析度设定在4K 后,DLSS 效能模式的FPS 值可以从56 FPS 提升到171 FPS,提升3 倍以上!
游戏实战的部分,我们先来看看一般尚未支援DLSS 3 的游戏,这部分所有的设定一律都调整到最高画质,光追、DLSS 模式则都选用画质模式,同时关闭垂直同步、动态解析度缩放等干扰FPS 表现的功能。
凭借着RTX 4090 FE 大幅度提升的性能,基本上要满足各种4K 解析度下游玩需求已经都是小菜一叠,不论是在《战神》还是《极限竞速:地平线》中,4K 解析度都能跑出160 FPS 以上的成绩,轻松满足绝对细腻流畅的娱乐体验。
在支援DLSS 3 功能的部分,在这边小编先说明,目前所有的游戏都尚在测试阶段,因此本篇测试都是使用NVIDIA 所提供的Beta测试版进行跑分,实际功能的实装日期还得视各款游戏而定。
而要开启DLSS 3 的方式很简单,其实就和过去开启与调整DLSS 模式的方式相同,只要到游戏的设定选单中即可,不同的地方在于,倘若游戏支援DLSS 3 功能,玩家就能在选项中找到名为「NVIDIA DLSS Frame Generation」的选项,开启后就能启用AI 插入画面的功能。
需要注意的是,由于DLSS 3 透过AI插入的画面是「额外」生成的,过程不见得会额外通知游戏程式本身,所以部分游戏倘若有提供内建跑分功能,「NVIDIA DLSS Frame Generation」所提升的FPS 值将不会被侦测到,玩家如果想要纪录或观看实际的FPS 值建议搭配NVIDIA 官方所推出的「Frame View」工具。
首先,先来看看没有支援光追,但效能需求依然庞大的《微软模拟飞行2020》,在不开启任何画质调节选项的状况时,游戏的在4K 解析度下的FPS 值为73,其实已经算得上流畅,不过在搭配DLSS 3 和画面插入功能后,就算是DLSS 画质模式,FPS 就能直接提升到149 张,符合官方的2 倍效能提升的宣传。
而在最近因为「老婆饼」事件而引发大量玩家回锅的《电驭叛客2077》中,小编特地比较了有开/关「NVIDIA DLSS Frame Generation」功能的FPS 值差异。
在同样4K 解析度状态下,无DLSS 帮助的时候,游戏的FPS 值仅有凄惨的38 张,而在开启DLSS 后,画质模式可以大幅提升到67 FPS,画面插入后更能飙到104 FPS!若是DLSS 效能模式+画面插入更是冲上140 FPS,成长幅度虽没有如官方说的4 倍那么夸张,但3.6 倍的幅度也已经是足够恐怖了。
最后,补上了即将在18 号上市的新作《瘟疫传说:安魂曲》的抢先体验测试,这是一款现今比较少见的潜行匿踪类型游戏,由于这款游戏还未正式推出,实际上市的表现可能会存在差异,测试期间也有发现不同场景间的FPS 值有着一定的差距,因此这边只让大家先见识一下DLSS 3 在提升流畅度上的表现。
看完游戏之后,我们也来看一下创作者方面的表现,毕竟这一次NVIDIA 也相当注重在AI 为3D 影像创作的效率提升,还将编码核心翻倍,让H.265、AV1 影片输出剪辑更为快速。
在3D 建模软体Blender 中,RTX 4090 FE 的三项场景分数为6421、2973、2989 分,总计12383 分,做为对比,Blender 官网上RTX 3090 Ti 的平均总得分为6272 分,RTX 4090 FE 确实如官方所说的有着翻倍的提升。
而在影片剪辑的Premiere Pro 中,得利于Ryzen 9 7950X 和RTX 4090 FE 双重强大硬体的结合,最终得到了1459 分的高分,这样的表现要剪辑4K 影片可谓是行云流水,甚至面对8K 解析度的素材也不是问题。
结语:比体积更狂暴的效能巨兽正式上阵
在过去曾有网路谣言指出NVIDIA 打算让RTX 40 系列的效能提升2 倍,就本次的RTX 4090 FE 在诸多方面表现来看,可以说是证实了这点。
利用DLSS 3 的AI 插入画面技术,让游戏的FPS 值能够获得直接翻倍的提升,同时在创作方面,AI 相关技术的导入,也同样带来了双倍的性能,直接将上一代的产品的效能远远抛在后头,见到如此巨大的效能增幅,卡片体积的「微幅」增加,似乎也变得情有可原了呢…(笑)
好啰!这次的RTX 4090 FE开箱与实测就介绍到这边,接下来将会是各家RTX 4090显示卡登场的时刻了,10/12即将正式开卖,各位玩家准备好银子了吗?