在看过NVIDIA GeForce RTX 4090 那猛爆的性能增幅后,还有更多人关心次一阶的 GeForce RTX 4080 是否也有相似的成长幅度,一起来看看它的表现吧!
规格解析
Ada Lovelace AD103 晶片全开状态
GeForce RTX 4080 同样采用Ada Lovelace 架构,但它使用的并非RTX 4090 的AD102 晶片,而是规模较小的AD103 晶片。
AD103 晶片全开可供应80 组SM (Streaming Multiprocessor),而RTX 4080 使用的AD103-300 晶片则只启用76 组SM,内含9728 个CUDA Core、76 个第3 代RT Core 和304 个第4 代Tensor Core,但仍配倍2 个可处理AV1 编码的第8 代NVENC 编码器。
显示记忆体规模相比RTX 4090 略有缩减,配置256-bit、16GB 的GDDR6X 记忆体,但其运作速率提升至22.8 Gbps,总频宽约为717 GB/s。
在晶片和记忆体规模都有缩减的情况下,RTX 4080 的整体功耗降至320W,比RTX 4090 的450W 低了不少。
创始版工艺
虽说GeForce RTX 4080 的功耗明显低于RTX 4090,但NVIDIA 供应的Founders Edition 创始版却使用与RTX 4090 相同的三槽散热器,包括均热板、热导管、铝合金框体、外露式散热片、超大正反面风扇和包装等要素一概没少。
供电端子仍然12VHPWR,而随货搭配的转接线则改用由3 组PCIe 8 pin 组合而成的,推测最大输出电力可达450W。
测试环境
接下来的测试,我们以初始定价同为US$ 1199 的NVIDIA GeForce RTX 3080 Ti 创始版当作基准,来看GeForce RTX 4080 创始版到底强化了多少。
中央处理器 | 英特尔酷睿 i9-13900K |
---|---|
主机板 | 华硕 ROG Maximus Z790 Hero |
记忆体 | 金士顿 FURY 野兽 DDR5-6000 16GBx2 |
散热器 | 华硕 ROG Strix LC II 360 ARGB 白色版 |
导热介质 | Thermalright TF8 |
显示卡 | NVIDIA GeForce RTX 3080 Ti 创始人版 |
储存 | 金士顿 FURY 叛徒 SSD 2TB 希捷 FireCuda 530 NVMe SSD 2TB |
电源 | FSP Hydro PTM PRO ATX 3.0 (PCIe 5.0) 1200W |
作业系统 | Windows 11 专业版 |
理论性能
要快速评断GPU 性能的最简单方法就是看它的单精度浮点运算(FP32)能力,NVIDIA 公布GeForce RTX 4080 的著色算力(通常是指FP32)为49 TeraFLOPs,我们实测到可达53.84 TeraFLOPs,是RTX 3080 Ti 实测数值的1.46 倍。
3DMark
指标性的3DMark 评分也有一定的参考价值,尤其是其中的GPU 分数。 RTX 4080 在模拟WQHD 1440p 解析度DirectX 12 游戏的Time Spy 测试中取得的GPU 分数领先 RTX 3080 Ti 约43%,4K UHD 解析度Time Spy Extreme 测试的GPU 分数也领先逾 40%。
近期新推出模拟的DirectX 12 Ultimate 游戏的Speed Way 测试仅提供总分,RTX 4080 领先 RTX 3080 Ti 近36%。
而模拟光线追踪游戏的Port Royal 测试中,RTX 4080 的性能近RTX 3080 Ti 的35%。 若是单看光线追踪的运算能力,RTX 4080 甚至是RTX 3080 Ti 的1.53 倍。
由于RTX 4080 支援的DLSS 3 导入了AI 补帧技术,因此在Performance 模式下,可达成原生画面的3.4 倍帧率表现。 RTX 3080 Ti 因为只支援DLSS 2,Performance 模式下的帧率只扩展到2.56 倍。 而RTX 4080 搭DLSS 3 的总帧率则是RTX 3080 Ti 搭DLSS 2 的1.78 ~ 1.85 倍。
传统光栅化游戏
在不套用光线追踪、DLSS 等特效的传统光栅化渲染游戏中,RTX 4080 于4K 2160p 解析度的平均fps 至少是RTX 3080 Ti 的1.3 倍,最高在《刺客任务3》(Hitman 3)、《极限竞速地平线5》(Forza Horizon 5)取得1.4 倍佳绩。
由于平台已换成Intel Core i9-13900K,加上RTX 4080 效能与RTX 4090 有些差距,解析度调降WQHD 1440p 时,大致上没遇到CPU 受限(CPU-bound)的状况,所以平均效能大约也领先 RTX 3080 Ti 约30%,最高仍出现在《极限竞速地平线5》约领先40%。
解析度再降至Full HD 1080p 后,遇到CPU 受限的游戏稍为增加一些,但整体平均仍维持约27% 性能增幅。
稍微要注意的是《CS: GO》可能尚未完成驱动最佳化,所以RTX 4080 效能表现逊于 RTX 3080 Ti,不过《虹彩六号:围攻行动》(Rainbow Six Siege)的表现就很正常。
光线追踪游戏
在不套用DLSS 效果的光线追踪游戏中,RTX 4080 于 4K 2160p、WQHD 1440p 解析度环境都平均领先RTX 3080 Ti 约35%,Full HD 1080p 解析度环境遇CPU 受限影响,平均领先约29.2%。
DLSS 游戏
由于RTX 4080 额外支援DLSS 3 的补帧特效,所以在《电驭叛客2077》(Cyberpunk 2077)和《F1 22》可分别取得 RTX 3080 Ti 的2 倍和1.8 倍效能,整体平均效能约为 RTX 3080 Ti 的1.5 倍。
深度学习 3
而像是《微软模拟飞行》(Microsoft Flight Simulator)这种出了名的「CPU 受限」游戏,RTX 4080 透过DLSS 3 Performance 模式可创造出高达2.72 倍的帧率。
其他如《电驭叛客2077》、《F1 22》、Unity 引擎的《Enemies》展示内容甚至可创造出超过3 倍的帧率。
一些采用Unreal 引擎的游戏如《暗影火炬城》(FIST: Forged In Shadow Torch)、《生死轮回》(Loopmancer)、《光明记忆:无限》(Bright Memory: Infinite)、《毁灭全人类2 重制版》(Destroy All Humans! 2 – Reprobed)等也开始支援DLSS 3,表现也不错。
功耗与温度
虽然RTX 4080 全卡功耗设定在320W,但用NVIDIA PCAT 工具实际量测电源供应器的12V 端子(透过转接线)和PCIe 插槽的总和供电,瞬间最高可达341W,但仍比RTX 3080 Ti 设定350W 但测得瞬间最高392W 低了些许。
温度方面由于动用了与RTX 4090 创始版相同的3 槽散热器,RTX 4080 创始版的GPU 晶片最高温仅测得61.6 °C,比 RTX 3080 Ti 创始版测得的76.2 °C 低了不少。 尤其新款散热器有针对记忆体接触强化,RTX 4080 创始版的记忆体温度更仅测得70°C,比RTX 3080 Ti 创始版还低了30 °C。
风扇转速由于会配合温度动态调整,RTX 4080 创始版最高转速约为1300 rpm,噪音明显比 RTX 3080 Ti 创始版最高近2100 rpm 安静许多。
总结
从最初的发布阵容与原始定价来推测,GeForce RTX 4080 16GB 版应该一开始就把目标放在取代 US$ 1200 的 RTX 3080 Ti 位阶。 然而在 GeForce RTX 4080 12GB 版取消上市计画后,只好由RTX 4080 16GB 版承担起整个80 等级的位阶。
若对照同一世代的RTX 4090,在售价只比RTX 4080 多了25%,但平均效能多出32.5% 的情况下,RTX 4080 的性价比确实略逊一筹。 毕竟实际定价也差了US$ 400(未税)/NT$ 14000(含税),就看消费者的预算有能力买到哪个位阶了。
单纯以相同售价位阶来考量,RTX 4080 相较RTX 3080 Ti 提供普通游戏1.3 倍、光追/DLSS 游戏1.5 倍效能增幅,其实还算可圈可点。
且我们在4K 解析度环境实测的绝大多数传统光栅化游戏的帧率都维持在100 fps 以上,光追游戏有一半以上维持在100 fps 附近或是更多,其余至少也有70 ~ 80 fps,再加上比RTX 3080 Ti 还要低的功耗,综观而言其表现超够力。
目前已有10 款已上市游戏支援 DLSS 3:
- 《瘟疫传说:安魂曲》(A Plague Tale: Requiem)
- 《光明记忆:无限》(Bright Memory: Infinite)
- 《毁灭全人类2 重制版》(Destroy All Humans! 2 - Reprobed)
- 《暗影火炬城》(F.I.S.T.: Forged In Shadow Torch)
- 《F1 22》
- 《逆水寒》(Justice)
- 《生死轮回》(Loopmancer)
- 《漫威蜘蛛人重制版》(Marvel's Spider-Man Remastered)
- 《微软模拟飞行》(Microsoft Flight Simulator)
- 《超级人物》
在11 月底前,还有4 款游戏陆续导入DLSS 3:
- 《微软模拟飞行》(Microsoft Flight Simulator):DLSS 3 支援现为beta 版本,正式版于11 月11 日随着Microsoft Flight Simulator Sim Update 11 以及该游戏的全新Microsoft Flight Simulator 40 周年纪念版一同推出。
- 《世界越野冠军赛Generations》(WRC Generations):FIA WRC 官方游戏将于11 月16 日推出并支援DLSS 3。
- 《极速快感:桀骜不驯》(Need for Speed Unbound) :11 月29 日推出并支援DLSS 3。
- 《战锤40K:黑潮》(Warhammer 40,000: Darktide): 11 月29 日推出并支援DLSS 3 及光线追踪。
可预见未来更多游戏导入DLSS 3 后,RTX 4080 会有更好的性能表现。
此外,这应该是80 等级的显卡首次配备高达16 GB 的显示记忆体,而且也具备2 个可处理 AV1 编码的第8 代NVENC 编码器,要应付准专业用户处理的大型渲染/编码专案也没问题。
话说回来,RTX 4080 创始版设计仍是相对有好处的,毕竟它动用了可以解掉来自RTX 4090 高达 450W 热量的散热器,压制热量只有320W 的全卡,无论温度和噪音表现都明显优于 RTX 3080 Ti 创始版,只可惜必须得多占用一槽空间。
目前最大的隐患可能存在于 12VHPWR 转接线,在NVIDIA 或其他AIC 板卡厂没有任何正式宣告的情况下,我们并不认为RTX 4090 或RTX 4080 显卡本身存在结构性问题而导致熔毁,但仍建议使用12VHPWR 直通线材,或者是由电源供应器厂商所提供的PCIe 8-pin 直通 12VHPWR 的模组线材以维护安全。
另一方面,GeForce RTX 4080 最大的挑战可能来自即将于12 月13 日上市的 AMD Radeon RX 7900 XTX / Radeon RX 7900 XT,毕竟可提供61 TeraFLOPs / 52 TeraFLOPs 的著色算力,但定价仅US$ 999 / 899,也许会给予不小的压力。