文章转自:http://blog.chinaunix.net/uid-22663647-id-1771775.html
学习参考:
http://blog.chinaunix.net/uid-7931217-id-3408366.html
http://www.360doc.com/content/17/0114/11/33093582_622384753.shtml
http://blog.youkuaiyun.com/qiurisuixiang/article/details/6648213
http://blog.youkuaiyun.com/youbang321/article/details/7815707
http://blog.youkuaiyun.com/sadjason/article/details/9705951
这几天一直在调试一个系统,系统的功能就是定时发送数据、接收数据然后解析收到的数据,转换成一定的格式存入数据库中。我为了并发操作,所以每接收到一个数据包,就调用pthread_create函数创建一个默认属性的线程进行处理。
系统一开始运行很正常,但是当接收到第299个数据包时,就发生异常,查看程序日志,得知原来自接收到299个数据包后,就不再解析接收到的数据。我本以为是网络的问题,于是,重启下程序,结果异常发生在了同样的位置。这时,我猜想可能是代码的问题,找到相关代码,如下:
|
从代码看不出什么异常,由于解析数据是调用pthread_create函数创建一个默认属性的线程进行处理,如果没有解析,那么,应该是pthread_create函数没有创建成功。而pthread_create函数创建失败最可能的原因应该就是系统资源不足,根据经验,线程的默认堆栈大小是1MB,就是说,系统每创建一个线程就要至少提供1MB的内存,那么,创建线程失败,极有可能就是内存不够用了。从代码中看不出有内存泄露的现象,有malloc的地方就会有free对应。而仍然出现问题,那么,唯一的解释就是pthread_create会导致内存泄露! pthread_create创建的线程结束后,系统并未回收其资源,从而导致了泄露。
然后从网上查了相关资料如下:
线程的分离状态决定一个线程以什么样的方式来终止自己。线程的默认属性是非分离状态,这种情况下,原有的线程等待创建的线程结束。只有当pthread_join()函数返回时,创建的线程才算终止,才能释放自己占用的系统资源。而分离线程不是这样子的,它没有被其他的线程所等待,自己运行结束了,线程也就终止了,马上释放系统资源。程序员应该根据自己的需要,选择适当的分离状态。
从上面的描述中可以得知如果调用pthread_create函数创建一个默认非分离状态的线程,如果不用pthread_join()函数,线程结束时并不算终止,所以仍然会占用系统资源。这里有如下几种方法解决这个问题:
1.使用pthread_join()函数回收相关内存区域。
|
2.可以调用 pthread_detach() 函数分离线程。
|
当然,也可以在 thread function 中调用。
|
3.使用线程属性。
|
根据实际需要,任选其一即可。
ps:最后,我写了个测试程序,然后用valgrind检查了一下。
测试程序:
|
编译链接:
[root@localhost ~]# gcc -g b.c -o b -lpthread
然后,用valgrind进行内存检查
[root@localhost ~]# valgrind --tool=memcheck --leak-check=full ./b
==20980== Memcheck, a memory error detector
==20980== Copyright (C) 2002-2009, and GNU GPL'd, by Julian Seward et al.
==20980== Using Valgrind-3.5.0 and LibVEX; rerun with -h for copyright info
==20980== Command: ./b
==20980==
ok
==20980==
==20980== HEAP SUMMARY:
==20980== in use at exit: 272 bytes in 1 blocks
==20980== total heap usage: 1 allocs, 0 frees, 272 bytes allocated
==20980==
==20980== 272 bytes in 1 blocks are possibly lost in loss record 1 of 1
==20980== at 0x4C1F1A0: calloc (vg_replace_malloc.c:418)
==20980== by 0x4010422: _dl_allocate_tls (in /lib64/ld-2.7.so)
==20980== by 0x4E2AB52: pthread_create@@GLIBC_2.2.5 (in /lib64/libpthread-2.7.so)
==20980== by 0x40059E: main (b.c:13)
==20980==
==20980== LEAK SUMMARY:
==20980== definitely lost: 0 bytes in 0 blocks
==20980== indirectly lost: 0 bytes in 0 blocks
==20980== possibly lost: 272 bytes in 1 blocks
==20980== still reachable: 0 bytes in 0 blocks
==20980== suppressed: 0 bytes in 0 blocks
==20980==
==20980== For counts of detected and suppressed errors, rerun with: -v
==20980== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 4 from 4)
确实有内存泄露。
修改测试程序:
|
编译链接:
[root@localhost ~]# gcc -g b.c -o b -lpthread
然后,用valgrind进行内存检查
[root@localhost ~]# valgrind --tool=memcheck --leak-check=full ./b
==21013== Memcheck, a memory error detector
==21013== Copyright (C) 2002-2009, and GNU GPL'd, by Julian Seward et al.
==21013== Using Valgrind-3.5.0 and LibVEX; rerun with -h for copyright info
==21013== Command: ./b
==21013==
ok
==21013==
==21013== HEAP SUMMARY:
==21013== in use at exit: 0 bytes in 0 blocks
==21013== total heap usage: 1 allocs, 1 frees, 272 bytes allocated
==21013==
==21013== All heap blocks were freed -- no leaks are possible
==21013==
==21013== For counts of detected and suppressed errors, rerun with: -v
==21013== ERROR SUMMARY: 0 errors from 0 contexts (suppressed: 4 from 4)
问题解决。