所有测试都是在支持第三代深度学习超级采样(DLSS 3)的游戏中进行的,凸显了这项新技术对于性能的极大助推作用,而后英伟达还提到了今明两天的内容。
今日游戏:
《微软飞行模拟器》-- 103 FPS
《战锤 40K:暗潮》-- 138 FPS
《虚幻引擎 5 - Lyra》光追演示 -- 155 FPS
《F1 22》光追演示 -- 204 FPS
《Unity Enemies》光追演示-- 89 FPS
《赛博朋克 2077》光追演示-- 141 FPS
明日游戏:
《赛博朋克 2077》光追最高档 / Overdrive 模式 -- 90 FPS
《NVIDIA Racer RTX》完全光追演示 -- 80 FPS
《Justice》完全光追演示 -- 81 FPS
《Portal RTX》完全光追演示 -- 117 FPS
如你所见,GeForce RTX 4090 能够显著提升支持高级光追特性的游戏性能。
● 比如《微软飞行模拟》和《战锤 40K:暗潮》仅获得 2 倍性能提升;
●《UE5 Demo》和《F1 22》可实现将近 3 倍提升;
●《Unity Demo》和《赛博朋克 2077》更是接近 4 倍提升。
CD Projekt RED 的游戏将很快更新支持 RT Overdrive 模式,启用 DLSS 3 后的 RTX 4090 可带来 4 倍速度提升体验 ——《Racer RTX》大约是 4.5 倍、《Justice》几乎 5 倍、《Portal RTX》也接近 6 倍。
然后英伟达探讨了 Ada Lovelace GPU 架构的专属优化光追硬件,可知率先引入光追的《战地 5》,每像素只需执行 39 次 RT 操作。但更先进的游戏 —— 比如《赛博朋克 2077》超速模式 —— 会大幅提升到 635 次。
首先是被称作着色器执行的重新排序,英伟达 GPU 工程高级副总裁 Jonah Alben 解释称:
在光追游戏中,如果一些光线照射到场景的不同区域,那么它们将无法运行相同的程序、并于首次光线运算后闲置。
好消息是,通过在光追管道中添加一个新的阶段,SER 能够结合在同一程序上运行的光线,从而提升效率。
据英伟达所述,SER 在《赛博朋克 2077》游戏中实现了显著的性能提升:
● Overdrive Mode —— 提升 44%
● Portal RTX —— 提升 29%
● Racer RTX —— 提升 20%
另一项 Ada Lovelace 架构创新,是英伟达为 RTX 40 系列带来的 DMM 置换微网格:
作为针对几何体的光追优化,第三代 RT 核心能够理解并处理优化的 BVH 包围体层次结构。
在改进 BVH 构建性能的同时,它还减少了对存储资源的需求,而且 Simplygon 和 Adobe 工具都将支持 DMM 。
最后,不透明度微贴图可使 RT 核心更易理解不规则物体该如何受到光线的影响 —— 该功能通过包含预定不透明状态(如半透明、不透明或未知)的蒙版而实现。
得益于此,OMM 可节省返回 SM 处理单元的时间、并在多项演示中将性能提升 10% 。至于和 DLSS 3、SER、DMM 和 OMM 相关的更多细节,还请耐心等待官方揭晓。
扫一扫
在手机上阅读