在CES 2025上,英伟达发布基于Blackwell架构的GeForce RTX 50系列消费级显卡。同时还带来了DLSS 4,具备多帧生成功能,在每个传统渲染的帧之间生成多达三个额外的帧,也是自2020年发布DLSS 2.0以来对其AI模型的最大升级,DLSS光线重建、DLSS超分辨率和DLAA将由Transformer模型驱动,这是Transformer模型首次在图形领域的实时应用。
在CES 2025期间,Digital Foundry采访了英伟达应用深度学习研究副总裁Bryan Catanzaro,讨论了DLSS 4的发布及在超分辨率、光线重建和帧生成等多方面的改进。
DLSS Transformer模型取代了之前DLSS使用卷积神经网络(CNN),用于超分辨率和光线重建,变得更加智能,实现了对场景的更深层次理解,从而生成提供更高稳定性、减少鬼影、运动细节更多以及场景边缘更平滑的像素。同时英伟达也对帧生成进行了大幅度修改,放弃了以前基于光流加速器的模型。
Bryan Catanzaro表示,当打造DLSS 3时,为了通过硬件加速来计算光流,但是没有足够的Tensor Core,也缺乏足够好的算法,还没有开发出一个能够在Tensor Core运行的实时光流算法来满足预期的计算量。光流加速器最初用于DLSS 3帧生成式有意义的,但是像光流这样的算法的任何硬件实现的困难之处在于很难改进,直到采用完全基于人工智能的解决方案来替代,就像DLSS 4所做的那样。
DLSS 4的帧生成功能更依赖于Tensor Core,但是使用了更少的显存,效率也更高。当被问及新技术是否可以移植到GeForce RTX 30系列等旧硬件时,Bryan Catanzaro没有否定这个可能性,认为主要是优化和工程的问题,另外还有最终的用户体验。
当GeForce RTX 40系列推出帧生成功能时,Bryan Catanzaro曾解释为什么是新款GPU独占,主要原因是有更好的光流硬件加速器,理论上上一代显卡也能支持,但是改进可能不会那么大。随着新机制不再依赖光流硬件加速器,似乎又开启了另一扇大门,然而新的帧生成功能对Tensor Core要求更高,但是旧的GPU架构配备的Tensor Core性能没那么好,不知道英伟达会如何实现这一目标。
此外,Bryan Catanzaro还强调了更新后Flip Metering与CPU解耦的重要性,这也是帧率提升的关键之一。
展开全文