英伟达DLSS 4大幅提升帧率确实很强 但事情并不简单

英伟达DLSS 4大幅提升帧率确实很强 但事情并不简单
2025年01月16日 14:41 CNMO

英伟达DLSS 4大幅提升帧率确实很强 但事情并不简单

  【CNMO科技】在2025年国际消费类电子产品展览会(CES 2025)上,英伟达凭借RTX 5090显卡的发布抢尽风头,带来了众多新技术,其中最为引人注目的是DLSS 4。DLSS 4技术为英伟达GPU引入了多帧生成功能,当RTX 50系列显卡上市时,能立即为超过75款游戏提供高达4倍的性能提升。

  然而,关于DLSS 4的实际运行机制,市场上存在诸多误解。这既受到了英伟达CEO某些可能产生误导的言论的影响,也与DLSS技术本身的重大变化有关。因此,市场上对于这项新技术的功能、能力以及重要限制存在着不少错误信息。

并不能“预测未来”

  关于正确理解DLSS 4工作原理的一大障碍,源自英伟达CEO黄仁勋在一次问答活动中的表述。面对媒体关于DLSS 4技术细节的询问,黄仁勋坚决否认DLSS 4采用了帧插值技术,而是将其描述为“预测未来”,而非“插值过去”。这一言论虽然有助于向公众普及DLSS 4等高级技术概念,却也不幸地引发了关于DLSS 4实际运作机制的误解。

  DLSS 4的多帧生成技术本质上运用了帧插值方法,这与DLSS 3的技术基础一致,也是其他帧生成工具(例如Lossless Scaling和AMD的FSR 3)所采纳的方法。帧插值的过程是:显卡先渲染两帧图像,然后通过算法分析这两帧间的差异,并据此“推算”出一个中间帧,即根据已渲染帧的差异预测出缺失帧的样貌。

  尽管关于生成帧的新技术(特别是英特尔的帧外推研究)的早期探索已经起步,但该技术仍处于发展阶段。尽管某些细节目前尚未公开,但多方信息已证实,DLSS 4确实采用了帧插值技术。这并不奇怪,因为这类渲染工具的发展往往伴随着大量研究论文的积累,最终才转化为如DLSS 4这样的市场产品。

  然而,这并不减损DLSS 4的性能优势。尽管在创建新帧时采用了与DLSS 3相似的技术,但这并不应掩盖DLSS 4所能达成的显著成效。

延迟并非线性增长

  英伟达对于DLSS 4采用帧插值技术保持低调的一个主要原因不难洞悉,帧插值可能会带来延迟问题。在使用帧插值工具时,需要在显示序列的首帧之前预先渲染两帧,随后执行插值操作,因此本质上会存在一定的延迟。

  部分媒体曾表达忧虑,希望了解“新的帧生成技术如何影响延迟”,另有媒体则指出“用户担忧多帧渲染可能加剧‘延迟’问题”。这些担忧源于对DLSS 4能够生成多个“虚拟”帧的直观理解,如果生成一帧会增加延迟,那么生成更多帧似乎会进一步加剧延迟。然而,事实并非如此简单。

  理解DLSS 4采用帧插值的关键在于无论是DLSS 3生成一个额外帧,还是DLSS 4生成三个额外帧,延迟的影响机制本质上是一致的,都需要先渲染两帧,并比较它们之间的差异。在两帧之间插入一帧、两帧或三帧,所引入的延迟增量并非线性增长。无论插值多少帧,该过程带来的延迟大致保持恒定。

  以实例说明,假设游戏以每秒60帧(fps)运行,即每帧间隔16.6毫秒。使用DLSS 3后,帧率翻倍至120 fps,但延迟并未减半至8.3毫秒;游戏画面虽更流畅,但帧间渲染间隔仍为16.6毫秒。同理,DLSS 4可将帧率提升至240 fps,即四倍于原始帧率,但延迟亦不会骤降至4.2毫秒,而是保持在16.6毫秒。

  这是对PC延迟的简化阐释,未考虑DLSS帧生成的运算开销、显示器及鼠标引入的延迟等因素,但有助于理解在帧插值中增加帧数时,核心延迟并不线性增长。帧间渲染时间间隔不变,所经历的延迟主要仍取决于DLSS帧生成前的基准帧率及工具开销。

  尽管大部分额外延迟源自缓冲额外帧的过程,但增加更多中间帧带来的延迟增量相对较小。DLSS计算渲染两帧间更多帧的额外延迟有限,因此DLSS 4与DLSS 3相比,延迟增加并不显著。

  DLSS 4的延迟特性与DLSS 3相似。若基准帧率较低,响应性与视觉流畅性之间可能出现脱节,这在DLSS 4中可能更为显著,但并不意味着延迟会急剧上升。因此,英伟达的新技术Reflex 2虽令人瞩目,但并非DLSS 4的必需配套。与DLSS 3一样,开发者为DLSS 4实现Reflex的基础版本即可。

DLSS 4的工作原理

  英伟达对于DLSS 4工作原理的说明或许会让人感觉它只是DLSS 3的自然演进,但实际上,两者之间存在显著的区别。DLSS 4之所以与众不同,很大程度上是因为它采用了全新的AI模型架构,更准确地说,是多种AI模型的集成应用。据英伟达详尽介绍,在执行超分辨率、光线重建及多帧生成任务时,DLSS 4会为每一帧渲染部署五个独立的AI模型,且这些模型都需在毫秒级时间内高效运行。

  针对DLSS 4的任务需求,英伟达摒弃了传统的卷积神经网络(CNN),转而采用视觉Transformer模型。这一转变带来了两大关键变化。一是引入了“自注意力”机制,使模型能够跨越多帧追踪像素的重要性,通过自我参照的方式,新模型能更精准地聚焦于问题区域,比如超分辨率处理中可能出现的细微闪烁问题。

  此外,Transformer模型还具备更高的可扩展性,为DLSS 4提供了远超以往CNN方法的参数数量。据英伟达透露,新的Transformer模型参数量实际上翻倍了。

  从展示的内容来看,英伟达声称这种新模型在提升稳定性和保留精细细节方面相较于CNN方法有了显著提升。值得注意的是,这些改进不仅限于RTX 50系列GPU,所有RTX显卡都能在支持DLSS 4的游戏中受益于这种新的Transformer模型,当然,这要在每代显卡支持的功能范围内。

写在最后

  尽管DLSS 4已经经过多次展示,但其真正的能力将在英伟达下一代GPU发布时得到全面检验。届时,用户将能在多款游戏和多种场景中评估DLSS 4的实际表现。

版权所有,未经许可不得转载

(本文来自于手机中国)

英伟达DLSS
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片