注: 本文章参考其他博客加上自身的理解总结而成
一、概念
线程定义
- 一个线程指的是进程中一个单一顺序的控制流,也称为轻量进程(LWP)
- 一个进程可以有很多线程,每个线程并行执行不同的任务
- 线程会拥有自己的堆栈(不共享),但是它与同一进程中的多个线程将共享该进程中的全局变量、文件描述符等系统资源
进程和线程的区别
- 根本区别:进程是最小的分配资源的单位,线程是最小的执行单位。
- 通信机制:对于不同的进程之间,它们具有独立的数据空间,数据进行传递只能通过通信的方式进行,方式不仅耗时,而且不方便。但同一进程下的线程之间共享数据空间,通信很方便且安全
- 内存分配:系统在运行的时候会为每个进程分配不同的内存空间,而线程除了CPU外,不会再分配空间,而是使用进程的资源空间
- 从属关系:线程是进程的一部分,进程一旦结束,所有线程都结束
线程的共享资源
- 文件描述符表
- 每种信号的处理方式
- 当前工作目录
- 用户ID和组ID
- 内存地址空间
线程的非共享资源
- 线程id
- 处理器现场和栈指针(内核栈)
- 独立的栈空间(用户空间栈)
- errno变量
- 信号屏蔽字
- 调度优先级
线程优缺点
优点
- 提高程序的并发性
- 开销小,不用重新分配内存
- 通信和共享数据方便
缺点
- 线程不稳定,linux线程的概念比信号还晚才出来,库函数实现,需要链接 -lpthread
- 多线程调试比较困难(gdb支持不好)
- 线程无法使用unix经典事件,例如信号
线程标识符
- 像每个进程有一个进程ID一样,每个线程也有一个线程ID
- 进程ID在整个系统中是唯一的,但线程不同,线程ID只在它所属的进程环境中有效
- 线程ID用pthread_t数据类型来表示
二、线程原语
因为Linux多线程是有库函数实现的,需要添加头文件#include <pthread.h>,且编译的时候需要链接 -lpthread 库
线程创建
#include <pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
void *(*start_routine) (void *), void *arg);
参数
- pthread_t *thread:传递一个pthread_t变量地址进来,用于保存新线程的tid(线程ID)
- const pthread_attr_t *attr:线程属性设置,如使用默认属性,则传NULL
- void *(*start_routine) (void *):函数指针,指向新线程应该加载执行的函数模块
- void *arg:指定线程将要加载调用的那个函数的参数
返回值
- 成功返回0,失败返回错误号。可以先用strerror()把错误码转换成错误信息再打印
获取调用线程号
#include <pthread.h>
pthread_t pthread_self(void);
返回值
- 返回当前线程号
线程退出
#include <pthread.h>
void pthread_exit(void *retval);
参数
- rval_ptr是线程结束时的返回值,可由其他函数获取,如pthread_join()。
注意
- 如果进程中任何一个线程调用exit()或_exit(),那么整个进程都会终止。
- 线程的正常退出方式有:线程从线程函数中返回、线程可以被另一个线程终止以及线程自己调用pthread_exit()函数
等待线程回收
函数说明:阻塞调用函数,直到指定的线程终止,若线程不回收就类型僵进程,占用资源
#include <pthread.h>
int pthread_join(pthread_t thread, void **retval);
参数
- pthread_t thread:回收线程的tid
- void **retval:接收退出线程传递出的返回值,不接收传NULL
返回值
- 成功返回0,失败返回错误号
取消进程
函数说明:取消线程,该函数在其他线程中调用,用来强行杀死指定的线程,也需要pthread_join回收
#include <pthread.h>
int pthread_cancel(pthread_t thread);
参数
- 线程ID号
线程清除
通过调用pthread_detach()函数,结束线程,资源由系统自动释放。不用调用pthread_join
#include <pthread.h>
int pthread_detach(pthread_t tid);
参数
- pthread_t tid:分离线程tid
返回值
- 成功返回0,失败返回错误号。
比较两个线程是否相等
#include <pthread.h>
int pthread_equal(pthread_t t1, pthread_t t2);
参数
- 两个线程的ID号
三、线程属性
linux下线程的属性是可以根据实际项目需要,进行设置,之前我们讨论的线程都是采用线程的默认属性,默认属性已经可以解决绝大多数开发时遇到的问题。如我们对程序的性能提出更高的要求那么需要设置线程属性,比如可以通过设置线程栈的大小来降低内存的使用,增加最大线程个数。
typedef struct
{
int etachstate; //线程的分离状态
int schedpolicy; //线程调度策略
structsched_param schedparam; //线程的调度参数
int inheritsched; //线程的继承性
int scope; //线程的作用域
size_t guardsize; //线程栈末尾的警戒缓冲区大小
int stackaddr_set; //线程的栈设置
void* stackaddr; //线程栈的位置
size_t stacksize; //线程栈的大小
}pthread_attr_t;
注:目前线程属性在内核中不是直接这么定义的,抽象太深,为方便理解,使用早期的线程属性定义,两者之间定义的主要元素差别不大。属性值不能直接设置,须使用相关函数进行操作
- 初始化的函数为pthread_attr_init,这个函数必须在pthread_create函数之前调用
- 之后须用pthread_attr_destroy函数来释放资源
- 默认的属性为非绑定、非分离、缺省M的堆栈、与父进程同样级别的优先级
线程属性初始化
先初始化线程属性,再pthread_create创建线程
#include <pthread.h>
int pthread_attr_init(pthread_attr_t *attr); //初始化线程属性
int pthread_attr_destroy(pthread_attr_t *attr); //销毁线程属性所占用的资源
线程的分离状态
线程的是否可结合状态决定线程以什么样的方式来终止自己。在任何一个时间点上,线程是可结合的(或非分离的,joinable)或者是分离的(detached)。
- 非分离状态:线程的默认属性是非分离状态,这种情况下,原有的线程等待创建的线程结束。只有当pthread_join()函数返回时,创建的线程才算终止,才能释放自己占用的系统资源。
- 分离状态:分离线程没有被其他的线程所等待,自己运行结束了,线程也就终止了,马上释放系统资源。应该根据自己的需要,选择适当的分离状态。
#include <pthread.h>
int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate); //设置线程属性,分离or非分
离
int pthread_attr_getdetachstate(pthread_attr_t *attr, int *detachstate); //获取程属性,分离or非分离
参数
- pthread_attr_t *attr:被已初始化的线程属性
- int *detachstate:可选为
PTHREAD_CREATE_DETACHED(分离线程)
PTHREAD _CREATE_JOINABLE(非分离线程)
注意
这里要注意的一点是,如果设置一个线程为分离线程,而这个线程运行又非常快,它很可能在pthread_create函数返回之前就终止了,它终止以后就可能将线程号和系统资源移交给其他的线程使用,这样调用pthread_create的线程就得到了错误的线程号。要避免这种情况可以采取一定的同步措施,最简单的方法之一是可以在被创建的线程里调用pthread_cond_timedwait函数,让这个线程等待一会儿,留出足够的时间让函数pthread_create返回。设置一段等待时间,是在多线程编程里常用的方法。
线程的栈大小
当系统中有很多线程时,可能需要减小每个线程栈的默认大小,防止进程的地址空间不够用,当线程调用的函数会分配很大的局部变量或者函数调用层次很深时,可能需要增大线程栈的默认大小。
函数pthread_attr_getstacksize和 pthread_attr_setstacksize提供设置
#include <pthread.h>
int pthread_attr_setstacksize(pthread_attr_t *attr, size_t stacksize);
int pthread_attr_getstacksize(pthread_attr_t *attr, size_t *stacksize);
参数
- attr 指向一个线程属性的指针
- stacksize 返回线程的堆栈大小
返回值
- 若是成功返回0,否则返回错误的编号
除上述对栈设置的函数外,还有以下两个函数可以获取和设置线程栈属性
#include <pthread.h>
int pthread_attr_setstack(pthread_attr_t *attr, void *stackaddr, size_t stacksize);
int pthread_attr_getstack(pthread_attr_t *attr, void **stackaddr, size_t *stacksize);
参数
- attr 指向一个线程属性的指针
- stackaddr 返回获取的栈地址
- stacksize 返回获取的栈大小
返回值
- 若是成功返回0,否则返回错误的编号
设置属性例子
#include <stdio.h>
#include <pthread.h>
#include <string.h>
#include <stdlib.h>
#define SIZE 0x10000
int print_ntimes(char *str)
{
sleep(1);
printf("%s\n", str);
return 0;
}
void *th_fun(void *arg)
{
int n = 3;
while (n--)
print_ntimes("hello xwp\n");
}
int main(void)
{
pthread_t tid;
int err, detachstate, i = 1;
pthread_attr_t attr;
size_t stacksize;
void *stackaddr;
pthread_attr_init(&attr);
pthread_attr_getstack(&attr, &stackaddr, &stacksize);
printf("stackadd=%p\n", stackaddr);
printf("stacksize=%x\n", (int)stacksize);
pthread_attr_getdetachstate(&attr, &detachstate);
if (detachstate == PTHREAD_CREATE_DETACHED)
printf("thread detached\n");
else if (detachstate == PTHREAD_CREATE_JOINABLE)
printf("thread join\n");
else
printf("thread un known\n");
/* 设置线程分离属性 */
pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
while (1)
{
/* 在堆上申请内存,指定线程栈的起始地址和大小 */
stackaddr = malloc(SIZE);
if (stackaddr == NULL)
{
perror("malloc");
exit(1);
}
stacksize = SIZE;
pthread_attr_setstack(&attr, stackaddr, stacksize);
err = pthread_create(&tid, &attr, th_fun, NULL);
if (err != 0)
{
printf("%s\n", strerror(err));
exit(1);
}
printf("%d\n", i++);
}
pthread_attr_destroy(&attr);
return 0;
}