Linux---多线程初识

最新推荐文章于 2025-10-22 21:27:40 发布

原创最新推荐文章于 2025-10-22 21:27:40 发布 · 259 阅读

0 ·

CC 4.0 BY-SA版权

Linux 专栏收录该内容

21 篇文章

订阅专栏

本文详细介绍了Linux线程的概念、优点和缺点。线程作为调度的基本单位，其创建成本低、切换速度快、资源占用少，适合于多处理器环境和I/O密集型应用。然而，线程间的资源共享可能导致健壮性降低，并存在性能损失和同步问题。在Linux中，线程是通过POSIX线程库实现，创建线程使用pthread_create函数。进程与线程的主要区别在于资源分配和调度的基本单位不同，线程共享进程资源但拥有自己的栈和寄存器等私有数据。

1. Linux线程概念

在一个程序里的一个执行路线就叫做线程（thread）。更准确的定义是：线程是“一个进程内部的控制序列”（线程是一个进程的虚拟地址空间内运行的执行流）
一切进程至少都有一个执行线程
线程在进程内部运行，本质是在进程地址空间内运行
在Linux系统中，在CPU眼中，看到的PCB都要比传统的进程更加轻量化（轻量级进程）
透过进程虚拟地址空间，可以看到进程的大部分资源，将进程资源合理分配给每个执行流，就形成了线程执行流

在这里插入图片描述
对于线程和进程的理解：

进程：承担分配系统资源的基本实体
线程：调度的基本单位，线程是进程里面的执行流。

在Linux中，没有真正意义上的线程（因为在Linux中没有针对线程专门的设计属于它的数据结构），线程是用进程模拟的。所以也可以把线程称作为“轻量级进程”

原来我们所认为看见了一个task_struct就认为是一个PCB，后面有一套完整的地址空间等，现在看见一个task_struct说不定它是由好几个task_struct共同使用的一个虚拟地址空间，且这一个task_struct只是完整进程的一部分。

1.1 线程的优点

创建一个新线程的代价要比创建一个新进程小得多(从上表也可以看出，只有第一个task_struct需要去申请虚拟地址空间，而其余的task_struct只需要去分配地址空间即可)
与进程之间的切换相比，线程之间的切换需要操作系统做的工作要少很多
线程占用的资源要比进程少很多
能充分利用多处理器的可并行数量
在等待慢速I/O操作结束的同时，程序可执行其他的计算任务
计算密集型应用，为了能在多处理器系统上运行，将计算分解到多个线程中实现
I/O密集型应用，为了提高性能，将I/O操作重叠。线程可以同时等待不同的I/O操作。

1.2 线程的缺点

性能损失

一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多，那么可能会有较大的性能损失，这里的性能损失指的是增加了额外的同步和调度开销，而可用的资源不变。

健壮性（鲁棒性）降低

编写多线程需要更全面更深入的考虑，在一个多线程程序里，因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的，换句话说线程之间是缺乏保护的。

缺乏访问控制

进程是访问控制的基本粒度，在一个线程中调用某些OS函数会对整个进程造成影响。

编程难度提高

编写与调试一个多线程程序比单线程程序困难得多

1.3 线程异常

单个线程如果出现除零，野指针问题导致线程崩溃，进程也会随着崩溃
线程是进程的执行分支，线程出异常，就类似进程出异常，进而触发信号机制，终止进程，进程终止，该进程内的所有线程也就随即退出

新创建的线程出现了除0错误，那么整个进程都会被杀死，因为OS系统发信号的单位是进程。所以有很多线程都会无辜的跟着死掉（这也就说明了鲁棒性不强）

在这里插入图片描述

2. Linux线程控制

对于OS系统是没有线程的概念的，线程要由用户来实现，所以需要依赖一个第三方库

POSIX线程库

与线程有关的函数构成了一个完整的系列，绝大多数函数的名字都是以“pthread_”打头的
要使用这些函数库，要通过引入头文<pthread.h>
链接这些线程函数库时要使用编译器命令的“-lpthread”选项

功能：创建一个新的线程
原型 int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine)(void*), void *arg);
参数：

thread:返回线程ID ， pthread_t可以理解为一个无符号长整形
attr:设置线程的属性，attr为NULL表示使用默认属性 （一般我们也不知道，所以就设置为NULL）
start_routine:是个函数地址，线程启动后要执行的函数
arg:传给线程启动函数的参数
返回值：成功返回0；失败返回错误码

他们打印出来的pid是一样的，说明是同一个进程，且是两个执行流。
在这里插入图片描述

ps -L是用来查看轻量级进程的命令语句,此时看到两个线程的PID是一样的，但是LWP（轻量级进程）是不一样的。

线程库NPTL提供了pthread_ self()函数，可以获得线程自身的ID

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
#include<pthread.h>

void *thread_run(void *arg)
{
  while(1){
    printf("I am %s, pid : %d ,my thread id is %p\n",(char*)arg,getpid(),pthread_self());
    sleep(1);
  }
}


int main()
{
  pthread_t tid;
  //你新创建的线程id就会放在tid中
  pthread_create(&tid,NULL,thread_run,(void*)"thread 1");

  while(1){
    printf("I am main thread id : %p,new thread  : %p, pid : %d\n",pthread_self(),tid,getpid());
    sleep(2);
  }

  return 0;
}

在这里插入图片描述
ldd mythread 查看进程/线程所依赖的动静态库，是需要依赖动态库的，那么动态库加载进来是放在虚拟地址空间的共享区的，

你所创建线程ID就是线程在pthread库当中的线程控制块的起始地址

2.1 进程和线程对比

进程是资源分配的基本单位
线程是调度的基本单位

线程共享进程数据，但也拥有自己的一部分数据:

 线程ID
 一组寄存器（线程硬件的上下文信息）
 栈
 errno
 信号屏蔽字
 调度优先级

进程的多个线程共享同一地址空间,因此Text Segment、Data Segment都是共享的,如果定义一个函数,在各线程中都可以调用,如果定义一个全局变量,在各线程中都可以访问到,除此之外,各线程还共享以下进程资源和环境:

 文件描述符表
 每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
 当前工作目录
 用户id和组id

进程和线程相比来说，进程更强调独立性，但也不是完全独立的（通信，以及fork）。
线程更强调共享，但也不是绝对共享，其中线程栈（线程和线程运行期间所产生的临时变量不会相互影响）和线程的寄存器（硬件上下文信息）（多个线程之间是可以切换的）是私有的