强制进程产生coredump，检测死锁以及进程快照

最新推荐文章于 2024-07-10 01:30:00 发布

转载最新推荐文章于 2024-07-10 01:30:00 发布 · 1.3k 阅读

文章标签：

#coredump

c/c++ 同时被 2 个专栏收录

17 篇文章

订阅专栏

linux

16 篇文章

订阅专栏

本文介绍在Linux环境下如何强制进程产生coredump文件以检测死锁及获取进程快照的方法。包括利用特定信号如SIGABRT来制造coredump,以及借助gdb在指定位置手动创建coredump以进行深入调试。

强制进程产生coredump，检测死锁以及进程快照

分类： LINUX

2011-03-17 22:12:04

作者：gfree.wind@gmail.com

博客：linuxfocus.blog.chinaunix.net

在软件开发的过程中，无论如何努力，bug几乎都是必不可少的。当某些bug发生时，该进程会产生coredump文件。通过这个coredump文件，开发人员可以找到bug的原因。但是coredump的产生，大都是因为程序crash了。

而有些bug是不会导致进程crash的，比如死锁——这时，程序已经不正常了，可是却没有coredump产生。如果环境又不允许gdb调试，难道我们就束手无策了吗？针对这种情况，一般情况下，对于这样的进程，可以利用watchdog监控它们，当发现这些进程很长时间没有更新其heartbeat时，可以给这些进程发送可以导致其产生coredump的信号。根据linux的信号默认的处理行为，SIGQUIT，SIGABRT, SIGFPE和SIGSEGV都可以让该进程产生coredump文件。这样我们可以通过coredump来得知死锁是否发生。当然，如果进程添加了这些信号的处理函数，那么就不会产生coredump了。不过，对于SIGABRT, SIGFPE, SIGSEGV，有谁会为它们加上信号处理函数呢。

还有一种情况，进程并没有死锁或者block在某个位置，但是我们需要在某个指定位置进行调试，获取某些变量或者其它信息。但是，有可能是客户环境或者生产环境，不允许我们进行长时间的检测。那么，我们就需要通过coredump来获得进程在运行到该点时的快照。

这个时候，可以利用gdb来产生手工产生coredump。在attach上这个进程时，在指定位置打上断点，当断点触发时，使用gdb的命令gcore，可以立即产生一个coredump。这样，我们就拿到了这个位置的进程快照。