启动故障的定位和排除--硬件<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
所谓启动故障,这里特指在引导系统之前出现故障.
A.解决计算机故障一般有以下4个步骤:
1,故障重现
2,故障定位
3,尝试排除
4,确认排除
B.主机启动的过程:(以下过程是从快速排错的角度出发所以描述的,是笼统的,忽略了一些细节,并不精确。)
1,主板加电
2,CPU初始化
3,主板BIOS初始化
4,内存初始化
5,显示系统初始化 (BIOS查找显卡BIOS,并通知其初始化,显存初始化)
6,其它设备初始化
7,引导操作系统
清楚了启动的过程,我们就可以以此为依据进行故障的定位。我们以下只讨论1-5的过程。
C.运用A点的4个步骤进行处理:
1,故障重现
故障重现就是要让故障重复出现一次或多次,为什么要做这一步呢?有两个好处:
a) “眼见为实”,用户所描述的情况有时并不准确,我们要亲自看到。(有时不是故障用户也报修- -~~)
b) 在故障重现时,维修者也可以借此时机对故障发生时的一些细节进行捕捉,这往往是解决问题的关键。
2,故障定位
一般我可以按照主机启动的过程,将其分为2大部分:
a) 第一部分是1-5(以下称“第一部分”),因为在此过程中出现的故障在显示器上是无法得到相关信息的,这也让一些新手朋友比较头疼的。
b) 第二部分是6-7,这一部分出现的故障基本上都可以从显示器上得到一些信息,处理起来也会容易很多。基本上按照提示结合本文中的处理方法即可,在此不再赘述.
c) 按上述方法先将故障定位在一个大的范围,再用进行进一步定位,下文有述。 3,尝试排除
这里说“尝试排除”是因为这个过程其实也是要结合进一步的故障定位一起进行的,中间要做很多次尝试。
尝试排除硬件故障的方法一般有以下3种:
a)插拔法重新插拔有嫌疑的部件或接头,使其正常接触,从而排除故障。
技巧:对于内存或显卡等部件,拔下后最好用橡皮将接触点擦一擦,可以有效的除去污垢和氧化层。
b) 替换法(替代法)对有嫌疑的部件进行替换,以达到排除故障的目地。
技巧:此方法一般结合插拔法一起使用,当插拔法无效时可以此法。
c) 排除法将有环境中有嫌疑的部件断开排除出去,以缩小断判范围,最后确定故障点。
技巧:参考启动过程中硬件的初始化顺序进行排除。
4,确认排除
这步很简单,但很重要,为了排除偶然性,我们一定要验证确认故障已排除。不然你刚走机器又坏了,那你的形像可就完了,呵呵。。其实主要是用户对你的信任度会下降的。本着认真负责的态度,所以还是要确认一下。
对于硬件故障来说,很简单,只要多重启几次机器就行了。
方式有:
a)复位
b)关机重开
c)完全断电一段时间重开机
D.进一步定位故障 网管的工作性质决定,我们处理单机故障的级别定位在一级,所以我们都以此为标准。
(维修分一级和二级,一级指板卡层面的维修,重点在于故障定位,排除的方法仅限于重新安装和更换部件,二级指芯片层面的维修,也叫芯片级维修,重点在故障定位和仪器测试,排除方法是通过专业工具对部件的元器件进行更换,如有必要,还会对部件进行改造)
1,进一步定位故障要结合以下3个方面:
a) 观察部件外观,听驱动器运行声音和报警,闻有无烧毁的味道。
b) 按故障现像分析故障,用下文件所述的内容,结合“尝试排除”的3种方法进行测试,将范围缩小。
c) 直觉。呵呵。。上面说过,第一部分中第3个过程很重要(主板BIOS初始化),因为此过程如果正常,那么在其之后出现的故障基本都会报警,换言之,如果主机不报警,就要查此过程之前的部分,如果报警,则可按照报警的信息查其后的部分。如何区分故障是发生在1-3过程中还是在4-5过程中呢?方法很简单,将内存拔掉,加电,听主机是否有报报警,一般情况下,如无报警,则为1-3过程有问题,如有,则4-5 过程有问题。
说明:主板报警代码是固化在BIOS中的,在BIOS初始化以后才有效,所以在1-3过程没有成功时,是不会报警的。
转载于:https://blog.51cto.com/307567/63628