RTX 5090遇诡异Bug完全无响应!悬赏1000美元寻解决方案

RTX 5090遇诡异Bug完全无响应!悬赏1000美元寻解决方案
2025年09月07日 23:23 快科技

快科技9月7日消息,据报道,NVIDIA的RTX 5090和RTX PRO 6000显卡最近被发现存在一个可复现的虚拟化重置漏洞,该漏洞会导致显卡完全无响应,直到主机系统物理重启才能恢复。

CloudRift是一家GPU云服务提供商,他们在生产环境中多个配备Blackwell芯片的系统上遇到了这个问题后,详细公布了问题的分析报告,并悬赏1000美元,公开征集能够找到解决方案或根本原因的人。

根据CloudRift的日志,这个漏洞发生在GPU通过KVM和VFIO传递给虚拟机后。在虚拟机关闭或GPU重新分配时,主机系统会发出一个PCIe功能级重置(FLR)。

但与正常情况不同的是,GPU并没有恢复到良好状态,而是停止响应,内核报告称:“FLR后65535毫秒仍未就绪;放弃。”

此时,显卡也变得无法被lspci读取,lspci会抛出“未知头部类型7f”的错误,CloudRift指出,唯一恢复正常操作的方法是对整个机器进行断电重启。

AI初创公司Tiny Corp也复现了CloudRift的发现,并直接提出了一个问题:“RTX 5090和RTX PRO 6000是否有硬件缺陷?我们已经调查过,但找不到解决方案。”

社区的讨论中,许多家庭用户和其他RTX 5090的早期采用者也报告了类似的问题,一位用户表示在关闭Windows虚拟机后,整个主机系统挂起,即使操作系统级别的重启后,GPU也无法重新初始化。

用户证实,切换PCIe ASPM或ACS设置并不能缓解故障,目前还没有报告称旧型号显卡(如RTX 4090)存在类似问题,这表明该漏洞可能仅限于NVIDIA的Blackwell系列。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:黑白

显卡gpu美元
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片