多线程

最新推荐文章于 2024-12-01 23:55:34 发布

qq_33436509

最新推荐文章于 2024-12-01 23:55:34 发布

阅读量163

点赞数

CC 4.0 BY-SA版权

分类专栏： Linux

本文链接：https://blog.youkuaiyun.com/qq_33436509/article/details/81875333

Linux 专栏收录该内容

18 篇文章

订阅专栏

本文详细阐述了Linux环境下线程的概念、实现原理及其与进程的区别。深入探讨了线程的资源管理、优缺点，并介绍了核心线程控制原语，如创建、退出、分离等操作。此外还讲解了线程属性及使用时的注意事项。

一，什么是线程

LWP：light weight process 轻量级的进程，本质仍是进程(在Linux环境下)

进程：独立地址空间，拥有PCB

线程：也有PCB，但没有独立的地址空间(共享)

区别：在于是否共享地址空间。独居(进程)；合租(线程)。

Linux下：线程：最小的执行单位

进程：最小分配资源单位，可看成是只有一个线程的进程。

二，linux内核线程实现原理

1. 轻量级进程(light-weight process)，也有PCB，创建线程使用的底层函数和进程一样，都是clone

2. 从内核里看进程和线程是一样的，都有各自不同的PCB，但是PCB中指向内存资源的三级页表是相同的

3. 进程可以蜕变成线程

4. 线程可看做寄存器和栈的集合

5. 在linux下，线程是最小的执行单位；进程是最小的分配资源单位

察看LWP号：ps –Lf pid 查看指定线程的lwp号。

三级映射：进程PCB --> 页目录(可看成数组，首地址位于PCB中) --> 页表 --> 物理页面 --> 内存单元，此过程通过mmu完成。

进程，线程与三级映射的关系

对于进程来说，相同的地址(同一个虚拟地址)在不同的进程中，反复使用而不冲突。原因是他们虽虚拟地址一样，但，页目录、页表、物理页面各不相同。相同的虚拟地址，映射到不同的物理页面内存单元，最终访问不同的物理页面。但！线程不同！两个线程具有各自独立的PCB，但共享同一个页目录，也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。实际上，无论是创建进程的fork，还是创建线程的pthread_create，底层实现都是调用同一个内核函数clone。如果复制对方的地址空间，那么就产出一个“进程”；如果共享对方的地址空间，就产生一个“线程”。

总结：对于进程来说，三级映射是不一样的，对于线程来说，虽然有不同的pcb但是三级映射是共享的。

因此：Linux内核是不区分进程和线程的。只在用户层面上进行区分。所以，线程所有操作函数 pthread_* 是库函数，而非系统调用。

三，线程的共享资源和非共享资源

共享资源：

1，进程地址空间（.text/.date/.bss/rodate/heap/共享库）

2，每种信号的处理方式

3，用户ID和组ID

4，当前工作目录

5，文件描述符表

非共享资源：

1，线程ID

2，处理器现场和栈指针（内核栈）

3，独立的栈空间（用户栈）

4，errno

5，信号屏蔽字

6，调度优先级

四，线程的优缺点

优点：

1，提高程序的并发性

2，开销小，节省资源

3，数据通信，共享资源方便

缺点：

1，库函数，不稳定

2，调试，编写困难，不支持gdb

3，对信号的支持不好

五，线程控制原语

1，pthread_self函数：

#include <pthread.h>

pthread_t pthread_self(void);

功能：获取线程ID

返回值：成功为0，没有失败

pthread_t 本质：在Linux下为无符号整数(%lu)，其他系统中可能是结构体实现

2，pthread_create函数

#include <pthread.h>

int pthread_create(pthread_t *thread, const pthread_attr_t *attr,

void *(*start_routine) (void *), void *arg);

返回值：成功：0；失败：错误号 -----Linux环境下，所有线程特点，失败均直接返回错误号。

pthread_t：当前Linux中可理解为：typedef unsigned long int pthread_t;

参数1：传出参数，保存系统为我们分配好的线程ID

参数2：通常传NULL，表示使用线程默认属性。若想使用具体属性也可以修改该参数。

参数3：函数指针，指向线程主函数(线程体)，该函数运行结束，则线程结束。

参数4：线程主函数执行期间所使用的参数。可以传NULL。如果要传一个整型过去，千万不要取地址，强制类型转换为void*就可以了。

3，pthread_exit函数

#include <pthread.h>

void pthread_exit(void *retval);

功能：将单个线程退出

retval：表示线程退出状态，通常传NULL

return，exit，pthread_exit区别

return：是函数退出，在线程函数中调用return相当于pthread_exit

exit：是进程退出，当进程退出时，线程都要退出

pthread_exit: 是线程退出

在线程函数中调用别的函数使用return不会使该线程退出，而pthread_exit就会使线程退出。

pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的，不能在线程函数的栈上分配，因为当其它线程得到这个返回指针时线程函数已经退出了。

4，pthread_join函数

#include <pthread.h>

int pthread_join(pthread_t thread, void **retval);

功能：阻塞等待线程退出，获取线程退出状态，回收线程（pcb）

返回值：成功：0；失败：错误号

thread：线程ID

retval：存储线程结束状态，注意是一个二级指针。可以传NUL。

如果要传形式是：一个指针取地址

pthread_join(tid, (void **)&retval);

retval情形总结：

1.如果thread线程通过return返回，retval所指向的单元里存放的是thread线程函数的返回值。

2，如果thread线程被别的线程调用pthread_cancel异常终止掉，retval所指向的单元里存放的是常数PTHREAD_CANCELED。

3，如果thread线程是自己调用pthread_exit终止的，retval所指向的单元存放的是传给pthread_exit的参数

4，如果对thread线程的终止状态不感兴趣，可以传NULL给retval参数

5，pthread_detach函数

#include <pthread.h>

int pthread_detach(pthread_t thread);

返回值：成功：0；失败：错误号

线程分离状态：指定该状态，线程主动与主控线程断开关系。线程结束后，其退出状态不由其他线程获取，而直接自己自动释放，自己释放pcb。不需要主线程再调用pthread_join，否则会产生错误.在创建线程后，即可调用函数。

6，pthread_cancel函数

#include <pthread.h>

int pthread_cancel(pthread_t thread);

返回值：成功：0；失败：错误号

线程的取消并不是实时的，而有一定的延时。需要等待线程到达某个取消点(检查点)。

取消点：是线程检查是否被取消，并按请求进行动作的一个位置。通常是一些系统调用creat，open，pause，close，read，write..... 也可以调用pthread_testcancel();表明到达取消点了。执行命令man 7 pthreads可以查看具备这些取消点的系统调用列表。

pthread_cancel函数一般是在别的线程中调用，比如在主线程中。

用pthread_cancel杀死了线程，再用pthread_join去回收会返回-1

7，pthread_cleanup_push函数和pthread_cleanup_pop函数

#include <pthread.h>

void pthread_cleanup_push(void (*routine)(void *),void *arg);

routine：清理函数

arg：清理函数参数

void pthread_cleanup_pop(int execute);

execute：是否在弹出清理函数时，执行该函数，非0执行，0不执行

总结：终止某个线程而不终止整个进程，有三种方法：

1. 从线程主函数return。这种方法对主控线程不适用，从main函数return相当于调用exit。

2. 一个线程可以调用pthread_cancel终止同一进程中的另一个线程。

3. 线程可以调用pthread_exit终止自己。

进程和线程原语比较

fork pthread_create

getpid pthread_self(void)

exit(10) pthread_exit(void*)

wait(void *) pthread_join(tid,void**) 回收进程/线程获取返回状态

kill pthread_cancel(tid)

pthread_detach(tid),

8，线程属性

线程属性

typedef struct

{

int etachstate; //线程的分离状态

int schedpolicy; //线程调度策略

struct sched_param schedparam; //线程的调度参数

int inheritsched; //线程的继承性

int scope; //线程的作用域

size_t guardsize; //线程栈末尾的警戒缓冲区大小

int stackaddr_set; //线程的栈设置

void* stackaddr; //线程栈的位置

size_t stacksize; //线程栈的大小

} pthread_attr_t;

线程属性主要包括如下属性：作用域（scope）、栈尺寸（stack size）、栈地址（stack address）、优先级（priority）、分离的状态（detached state）、调度策略和参数（scheduling policy and parameters）。默认的属性为非绑定、非分离、缺省的堆栈、与父进程同样级别的优先级。