今天遇见一个超郁闷的BUG,现象非常奇怪:
delete pointer;
删除一个指针的时候程序发生core dump,或者在此处挂死。
从原理上分析,new出来的一块内存,会在内存的头或者尾处加上一个标记,说明块内存的大小。
我猜想,一定是指针越界,导致了开始或者末尾的这块标记被破坏,所以delete发生挂死。
检查了若干次后,也没发现指针越界的情况。
而且单独写了一个程序来故意破坏new出来的内存块的开头和结尾,结果指针越界的时候,程序立即core dump,说明Linux操作系统明确禁止了越界的指针。
实在没办法,采用逐行注释的办法,最终定位到一个一行代码上。检查这行代码所在的类,仍没发现这个方法有问题。
于是把这个类单独提取出来,模拟同样的new和delete操作,最后才发现是Close()方法中,delete掉一个内部的指针后没有赋值为NULL,然后析构函数中又调用Close(),导致一块内存连续被释放两次。
奇怪的是,这个类发生的内存问题,并没有在第二次delete的时候发生问题,而是在我自己的代码中,delete另一个指针的时候发生挂死————我取名为堆破坏。如果不阅读LINUX的源码,还没办法说明为什么会这样。
还奇怪的是,我当时调试用的LINUX服务器是2.4内核的,当把有问题的代码放到2.6内核的服务器上调试时,完全没问题,看来linux 2.6内核能够对两次delete同一指针的问题进行容错。
说了那么多,总结一下:注意,Linux 2.4内核的操作系统中,两次delete同一内存后,将发生堆破坏,再次delete其他指针的时候可能发生core dump或者挂死!
delete pointer;
删除一个指针的时候程序发生core dump,或者在此处挂死。
从原理上分析,new出来的一块内存,会在内存的头或者尾处加上一个标记,说明块内存的大小。
我猜想,一定是指针越界,导致了开始或者末尾的这块标记被破坏,所以delete发生挂死。
检查了若干次后,也没发现指针越界的情况。
而且单独写了一个程序来故意破坏new出来的内存块的开头和结尾,结果指针越界的时候,程序立即core dump,说明Linux操作系统明确禁止了越界的指针。
实在没办法,采用逐行注释的办法,最终定位到一个一行代码上。检查这行代码所在的类,仍没发现这个方法有问题。
于是把这个类单独提取出来,模拟同样的new和delete操作,最后才发现是Close()方法中,delete掉一个内部的指针后没有赋值为NULL,然后析构函数中又调用Close(),导致一块内存连续被释放两次。
奇怪的是,这个类发生的内存问题,并没有在第二次delete的时候发生问题,而是在我自己的代码中,delete另一个指针的时候发生挂死————我取名为堆破坏。如果不阅读LINUX的源码,还没办法说明为什么会这样。
还奇怪的是,我当时调试用的LINUX服务器是2.4内核的,当把有问题的代码放到2.6内核的服务器上调试时,完全没问题,看来linux 2.6内核能够对两次delete同一指针的问题进行容错。
说了那么多,总结一下:注意,Linux 2.4内核的操作系统中,两次delete同一内存后,将发生堆破坏,再次delete其他指针的时候可能发生core dump或者挂死!