Linux 故障排除全攻略
1. 内核启动问题排查
1.1 内核启动过程
当你选择好要启动的内核后,引导加载程序会尝试运行内核,包括初始 RAM 磁盘的内容,这里面包含了启动特定硬件所需的驱动程序和其他软件。
启动内核时,对于 RHEL 系统,你会看到一个带有缓慢旋转图标的 Red Hat Enterprise Linux 屏幕。若想查看详细的启动过程消息滚动,按下 Esc 键即可。
1.2 关注硬件驱动加载情况
此时,内核会尝试加载使用计算机硬件所需的驱动程序和模块。需要重点关注可能导致某些功能无法正常工作的硬件故障,虽然现在这种情况比以前少见,但仍可能存在硬件没有可用驱动,或者加载了错误的驱动而导致错误。
1.3 查看内核启动消息
内核启动时产生的消息除了在屏幕上滚动显示外,还会被复制到内核环形缓冲区。计算机完全启动后,你可以登录系统,使用以下命令将这些内核消息捕获到一个文件中,再使用 less
命令查看:
# dmesg > /tmp/kernel_msg.txt
# less /tmp/kernel_msg.txt
你可以将内核消息定向到一个文件(文件名可随意选择),以便后续检查或发送给能帮助调试问题的人。要重点关注未能加载的驱动程序或显示硬件某些功能未能启用的消息。
1.4 示例问题解决
例如,曾经遇到电视调谐卡检测到错误的调谐器类型,通过调谐卡的型号信息和故障类型,向卡的驱动程序传递选