gdb core 进程异常退出 宕机dump来判断宕机原因

本文详细介绍了如何通过core文件和gdb进行程序异常调试,包括core文件的生成开关与大小限制配置,查看core文件的方法及核心文件在不同信号触发时的产生机制。此外,文章还探讨了gdb跟踪守护进程和多线程调试技巧,以及在不同Unix信号下产生core文件的原理。

在程序不寻常退出时,内核会在当前工作目录下生成一个core文件(是一个内存映像,同时加上调试信息)。使用gdb来查看core文件,可以指示出导致程序出错的代码所在文件和行数。

  1.core文件的生成开关和大小限制

  1)使用ulimit -c命令可查看core文件的生成开关。若结果为0,则表示关闭了此功能,不会生成core文件。

  2) 使用ulimit -c filesize命令,可以限制core文件的大小(filesize的单位为kbyte)。若ulimit -c unlimited,则表示core文件的大小不受限制。如果生成的信息超过此大小,将会被裁剪,最终生成一个不完整的core文件。在调试此core文 件的时候,gdb会提示错误。

5. core 文件

  * 开启或关闭core文件的生成

  ulimit -c 可以查看是否打开此选项,若为0则为关闭;

  ulimit -c 0可手动关闭

  ulimit -c 1000 为设置core文件大小最大为1000k

  ulimit -c unlimited 设置core文件大小为不限制大小

  很多系统在默认的情况下是关闭生成core文件的,这个命令可以加到你的profile中去

3.core文件的查看

  core文件需要使用gdb来查看。

  gdb ./a.out

  core-file core.xxxx

  使用bt命令即可看到程序出错的地方。

  以下两种命令方式具有相同的效果,但是在有些环境下不生效,所以推荐使用上面的命令。

  1)gdb -core=core.xxxx

  file ./a.out

  bt

  2)gdb -c core.xxxx

  file ./a.out

  bt

gdb跟踪守护进程 set follow-fork-mode child

gdb跟踪多线程 info threads

set scheduler-locking off|on|step

估计是实际使用过多线程调试的人都可以发现,在使用step或者continue命令调试当前被调试线程的时候,其他线程也是同时执行的,怎么只让被调试程序执行呢?通过这个命令就可以实现这个需求。

off 不锁定任何线程,也就是所有线程都执行,这是默认值。

on 只有当前被调试程序会执行。

step 在单步的时候,除了next过一个函数的情况(熟悉情况的人可能知道,这其实是一个设置断点然后continue的行为)以外,只有当前线程会执行。

当程序接收到以下UNIX信号会产生core文件:

名字

说明

ANSI C POSIX.1

SVR4 4.3+BSD

缺省动作

SIGABRT

异常终止(abort)

. .

. .

终止w/core

SIGBUS

硬件故障

.

. .

终止w/core

SIGEMT

硬件故障

. .

终止w/core

SIGFPE

算术异常

. .

. .

终止w/core

SIGILL

非法硬件指令

. .

. .

终止w/core

SIGIOT

硬件故障

. .

终止w/core

SIGQUIT

终端退出符

.

. .

终止w/core

SIGSEGV

无效存储访问

. .

. .

终止w/core

SIGSYS

无效系统调用

. .

终止w/core

SIGTRAP

硬件故障

. .

终止w/core

SIGXCPU

超过CPU限制(setrlimit)

. .

终止w/core

SIGXFSZ

超过文件长度限制(setrlimit)

. .

终止w/core

在系统默认动作列,“终止w/core”表示在进程当前工作目录的core文件中复制了该进程的存储图像(该文件名为core,由此可以看出这种功能很久之前就是UNIX功能的一部分)。大多数UNIX调试程序都使用core文件以检查进程在终止时的状态。

core 文件的产生不是POSIX.1所属部分,而是很多UNIX版本的实现特征。UNIX第6版没有检查条件 (a)和(b),并且其源代码中包含如下说明:“如果你正在找寻保护信号,那么当设置-用户-ID命令执行时,将可能产生大量的这种信号”。4.3 + BSD产生名为core.prog的文件,其中prog是被执行的程序名的前1 6个字符。它对core文件给予了某种标识,所以是一种改进特征。

表中“硬件故障”对应于实现定义的硬件故障。这些名字中有很多取自UNIX早先在DP-11上的实现。请查看你所使用的系统的手册,以确切地确定这些信号对应于哪些错误类型。

下面比较详细地说明这些信号。

? SIGABRT 调用abort函数时产生此信号。进程异常终止。

? SIGBUS 指示一个实现定义的硬件故障。

? SIGEMT 指示一个实现定义的硬件故障。

EMT这一名字来自PDP-11的emulator trap 指令。

? SIGFPE 此信号表示一个算术运算异常,例如除以0,浮点溢出等。

? SIGILL 此信号指示进程已执行一条非法硬件指令。

4.3BSD由abort函数产生此信号。SIGABRT现在被用于此。

? SIGIOT 这指示一个实现定义的硬件故障。

IOT这个名字来自于PDP-11对于输入/输出TRAP(input/output TRAP)指令的缩写。系统V的早期版本,由abort函数产生此信号。SIGABRT现在被用于此。

? SIGQUIT 当用户在终端上按退出键(一般采用Ctrl-\)时,产生此信号,并送至前台进

程组中的所有进程。此信号不仅终止前台进程组(如SIGINT所做的那样),同时产生一个core文件。

? SIGSEGV 指示进程进行了一次无效的存储访问。

名字SEGV表示“段违例(segmentation violation)”。

? SIGSYS 指示一个无效的系统调用。由于某种未知原因,进程执行了一条系统调用指令,

但其指示系统调用类型的参数却是无效的。

? SIGTRAP 指示一个实现定义的硬件故障。

此信号名来自于PDP-11的TRAP指令。

? SIGXCPU SVR4和4.3+BSD支持资源限制的概念。如果进程超过了其软C P U时间限制,则产生此信号。

? SIGXFSZ 如果进程超过了其软文件长度限制,则SVR4和4.3+BSD产生此信号。


原文:http://bingheleiyu.blog.163.com/blog/static/957381920131182540614/

<think>好的,用户想了解如何在Ubuntu系统中查看宕机日志。我需要先理清常见的日志位置和工具,确保涵盖主要的排查方法。首先,系统日志通常存储在/var/log目录下,特别是syslog和kern.log这两个文件,可能包含有关系统崩溃的信息。得提到用less或者tail命令查看这些日志。 然后,journalctl命令是systemd的一部分,可以用来查询系统日志,可能需要指导用户如何使用时间过滤或者指定服务来查找崩溃相关的条目。接着,如果有核心转储文件,用户可能需要检查/var/crash目录,并安装相应的调试工具来分析。 另外,用户可能遇到内核崩溃的情况,这时候可能需要检查dmesg的输出,以及安装kdump工具来捕获更详细的信息。还有应用程序自身的日志文件,比如在/var/log下的nginx、mysql等,也可能是问题源头,需要提示用户根据具体应用查看相关日志。 最后,要确保用户知道如何安全地查看日志,避免使用vim直接打开大文件,推荐使用less。另外,可能需要提醒用户安装必要的工具,比如apport和core dump分析工具,以及如何配置系统生成核心转储。整个流程需要分步骤说明,结构清晰,让用户能一步步排查问题。</think>在Ubuntu系统中排查宕机问题,可按照以下步骤查看关键日志: 1. **系统日志目录** - 核心日志文件位于:`/var/log` - 重点关注: ```bash less /var/log/syslog # 系统事件综合日志 less /var/log/kern.log # 内核相关日志 ``` 2. **使用journalctl查询系统日志** ```bash journalctl -b -1 -p err # 查看上次启动的错误日志(-b -1表示前一次启动) journalctl --since "2023-08-01 14:00" --until "2023-08-01 15:00" ``` 3. **核心转储分析** - 检查崩溃转储文件: ```bash ls /var/crash/ # Apport自动生成的崩溃报告 ``` - 需安装调试工具: ```bash sudo apt install gdb apport-retrace apport-unpack /var/crash/_opt_xxx.crash ./crash_report ``` 4. **内核oops信息** ```bash dmesg -T | grep -i "Oops" # 查看内核错误信息(-T显示可读时间戳) ``` 5. **专用崩溃记录工具** - 安装kdump工具: ```bash sudo apt install linux-crashdump ``` - 崩溃日志路径:`/var/crash/<时间戳>/vmcore` 6. **应用程序日志** ```bash /var/log/nginx/error.log # Web服务器错误示例 /var/log/mysql/error.log # 数据库错误示例 ``` **排查建议:** 1. 使用`tail -f`实时监控日志变化 2. 按时间范围过滤日志(结合宕机发生时间) 3. 大文件建议用`less`代替`vim`查看 4. 重要日志建议先备份再操作 如果存在持续宕机问题,建议: 1. 检查硬件健康状态(内存、硬盘) 2. 更新系统内核和关键驱动 3. 监控系统资源使用情况(内存、CPU、IO) 4. 启用持久化journal日志: ```bash sudo mkdir /var/log/journal sudo systemctl restart systemd-journald ``` 遇到具体错误信息时,可复制相关日志段落进行更深入的分析。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值