公司的电脑是联想的刃7000k,最近工作时,总是频繁随机重启,无奈打开事件查看器,这一看,吓了一跳
满屏的WHEA-Logger 17 警告:
发生了已更正的硬件错误。
组件: PCI Express Root Port
错误源: Advanced Error Reporting (PCI Express)
主总线: 设备: 函数: 0x0: 0x1: 0x0
辅助总线: 设备: 函数: 0x0: 0x0: 0x0
主要设备名称: PCI\VEN_8086&DEV_4C01&SUBSYS_373317AA&REV_01
辅助设备名称:
找了公司运维,鼓捣了一下午,找到了重启后的dmp文件,分析之后原因指向了英伟达的显卡驱动nvlddmkm.sys。联想官方的驱动装了之后依旧是不停的报警告。
这只能自己解决了!
这里补充一下电脑的配置:
i5-11400F/ 16G/ 500G/ GT1030
看了网上大家总结的方法,我也都尝试了,比如将PCIE设备、内存重新插拔、更新英伟达官方驱动、更新BIOS、替换新的nvlddmkm.sys文件都无法消除警告。
之后在知乎里找到了一个答案:【已解决】英伟达显卡驱动停止响应问题的解决
似乎发现了一些灵感,将电源管理中的最小处理器状态设置为100%。但是似乎没起到什么作用。
想想还是从警告本身入手吧,在设备管理器中查找硬件ID为警告中提到的“PCI\VEN_8086&DEV_4C01&SUBSYS_373317AA&REV_01”
找到之后发现是 Intel(R) PEG10 - 4C01设备,查找之后发现还是与显卡相关,但是我这个机器只有一块独显,没有核显,无法禁用该设备。于是按照这个思路区找这个设备相关的问题。发现遇到同样问题的显卡,不止是GT1030,甚至RTX2070、RTX3060、RTX3060TI、3090等等显卡都会出现类似问题,而主板又多指向技嘉,可能与PCIEX16 插槽有关
紧接着我又在Intel的社区中发现了这样一条回答,感觉比较靠谱,决定一试:
按照这个步骤,逐步设置,设置完成后,成了!!!!无数的WHEA-Logger 17 警告终于停下来了
总结:
这个警告归根结底还是因为供电异常引起的,我觉得在我排除故障的过程中,两个操作是最重要的:
1、将处理器电源管理中的最小处理器状态设置为100%
2、NVIDIA控制面板中将电源管理模式设置为首选最高性能
这里再附上Intel论坛中的其他信息: