操作系统笔记_判断线程是繁忙还是堵塞-优快云博客

本文链接：https://blog.youkuaiyun.com/shouchen1/article/details/132528199

该博客围绕操作系统展开，详细介绍了进程和线程的概念、区别、创建方式、通信与同步方法等，还探讨了堆和栈、上下文、并发互斥、内存管理等内容，如内存分配、虚拟内存、内存碎片等，同时提及死锁处理、系统调用等知识。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

操作系统

进程和线程

什么是进程？什么是线程？

进程是资源分配的基本单位，它是程序执行时的一个实例，在程序运行时创建。
线程是程序执行的最小单位，是进程的一个执行流，一个线程由多个线程组成的。

进程和线程有什么区别？

进程是资源分配的最小单位，线程是程序执行的最小单位。

进程拥有独立的地址空间，线程共享相同的地址空间。

进程间切换开销较大，线程间切换开销较小。

何时使用多进程，何时使用多线程？

对资源的管理和保护要求高，不限制开销和效率时，使用多进程。
要求效率高，频繁切换时，资源的保护管理要求不是很高时，使用多线程。

进程有几种状态？画一下进程状态转换图？

创建进程有哪几种方式?

创建进程的几种方式包括：

fork()系统调用：通过在父进程中调用fork()，创建一个与父进程相同的子进程，子进程从fork()函数返回处开始执行。
exec()系列系统调用：通过在进程中调用exec()系列函数，将当前进程的地址空间替换为新的可执行程序，从而创建一个新的进程并开始执行。

进程间通信方式有哪些？有什么优缺点？

管道（Pipe）：单向通信，适合具有亲缘关系的进程，但只能在父子进程或兄弟进程之间使用。
信号量（Semaphore）：用于进程间同步和互斥操作，可以实现临界区保护和资源共享，但复杂度较高。
消息队列（Message Queue）：可以实现进程间的异步通信，通过系统内核进行消息传递，但需要编程复杂。
共享内存（Shared Memory）：多个进程共享一块内存区域，读写效率高，但需要自己进行同步和互斥操作。
套接字（Socket）：适用于网络编程和分布式系统，可以实现不同主机之间的进程通信，但复杂度较高。

总结：管道简单但局限性高；信号量可用于同步和互斥，但复杂度较高；消息队列实现异步通信，但编程复杂；共享内存读写效率高，但需要自行处理同步；套接字适用于网络编程，但复杂度较高。

线程间同步方法有哪些？

临界区、互斥锁、信号量和事件是常用的线程间同步方法。临界区用于串行化访问共享资源，互斥量实现资源的独占访问，信号量控制并发线程数量，事件用于线程间的通知机制。选择适当的方法可以实现线程间的同步和互斥操作。

内核线程和用户线程？

内核线程由操作系统内核创建和管理，运行在内核态，拥有直接访问系统资源的权限。

用户线程由应用程序开发者创建和管理，运行在用户态，依赖于操作系统提供的线程库进行调度。内核线程消耗更多系统资源，而用户线程的创建和切换开销相对较小。

内核线程和用户线程有什么优缺点？

内核线程的优点是具有更高的性能和更广的功能，可以直接访问系统资源；缺点是创建和切换开销较大。

用户线程的优点是轻量级且创建和切换开销相对较小；缺点是受限于用户态的限制，无法直接访问系统资源。

什么是僵尸进程，孤儿进程，守护进程？

僵尸进程是指子进程在结束运行后，父进程未能及时回收其资源导致的进程状态，它已经停止运行但仍然占用系统资源。

孤儿进程是指父进程先于子进程退出，子进程成为没有父进程的进程，由 init 进程接管其管理。

守护进程是在后台运行的长期运行的进程，通常用于系统服务或后台任务，独立于终端会话，并且不受用户登录或注销的影响。

僵尸进程有什么危害？

僵尸进程占用系统资源，包括进程标识符（PID）和一些内核数据结构，会导致系统资源的浪费。如果僵尸进程过多积累，可能会耗尽系统资源，导致系统运行不稳定或崩溃。

如何清理僵尸进程？

通过父进程调用wait()或waitpid()系统调用来回收子进程的资源，确保子进程正常退出。

如何唤醒被阻塞的socket线程？

发送一个信号或者通过消息队列通知线程，从而使其从阻塞状态返回并继续执行。

如何确定当前线程是繁忙还是阻塞？

可以通过ps命令检查线程的状态或者当前所执行的任务/代码来确定当前线程是繁忙还是阻塞。如果线程正在主动执行任务或代码，则可以判断为繁忙；而如果线程在等待某个资源、锁或IO操作完成时，则可以判断为阻塞。

空闲的进程和阻塞的进程状态会不会在唤醒的时候误判？

在唤醒时，空闲的进程和阻塞的进程状态有可能被误判，因为它们在外部观察上可能非常相似。

唤醒操作需要根据具体的上下文和条件进行判断，以避免误判并确保准确地唤醒目标线程。

请问就绪状态的进程在等待什么？

就绪状态的进程在等待系统资源（如CPU时间片、内存等）以及满足执行条件（如等待某个事件完成或等待某个条件变为真）时，等待被调度器选择执行。

如何实现线程池？

实现线程池需要创建一个固定数量的线程集合，并使用任务队列来管理待执行的任务。

线程池接收任务后，将任务放入任务队列中，空闲的线程从队列中获取任务并执行，执行完毕后继续获取下一个任务，以此循环重复。

请你回答一下fork和vfork的区别？

fork 是创建一个子进程，子进程会复制父进程的所有资源，包括代码、数据和文件描述符；

vfork 是创建一个共享地址空间的子进程，子进程会共享父进程的地址空间，通常用于在子进程中立即执行 exec 系统调用，不会复制父进程的资源。

server端监听端口，但还没有客户端连接进来，此时进程处于什么状态？

当服务器端监听端口但没有客户端连接进来时，进程处于阻塞状态，等待客户端的连接请求。

具体来说，它可能在 accept() 系统调用处于阻塞状态，等待接受客户端的连接请求。

堆和栈

什么是代码段，数据段，bss段，堆，栈？

代码段是存储程序执行指令的区域；数据段是存储已初始化的全局变量和静态变量的区域；bss段（Block Started by Symbol）是存储未初始化的全局变量和静态变量的区域；堆用于动态内存分配，由程序员手动管理；栈用于存储函数调用时的局部变量和函数调用信息，由编译器自动管理。

为什么堆的空间不是连续的？

堆的空间不是连续的，主要是因为在动态内存分配过程中，频繁的申请和释放可能导致堆内存块的碎片化，留下了无法利用的间隙。这些空隙可能太小而无法容纳新的内存分配需求，因此堆空间不是完全连续的。

什么是用户栈和内核栈？

用户栈是用于存储用户程序的函数调用信息、局部变量和临时数据的栈空间，位于用户空间；内核栈是用于保存内核执行过程中的函数调用信息、异常处理等的栈空间，位于内核空间。两者分别用于不同的执行环境，用户栈用于用户程序执行，内核栈用于内核执行。

用户栈和内核栈，为什么不能共用一个栈？

用户栈和内核栈不能共用一个栈是因为它们分别用于存储用户空间和内核空间的运行时数据。

用户栈用于保存用户程序的函数调用信息及局部变量，而内核栈用于保存内核执行过程中的函数调用信息、异常处理等，为了保证安全和隔离，它们需要分开使用不同的栈空间。

线程具有相同的堆栈？

线程在共享相同的代码段和堆，但每个线程都有独立的栈空间。每个线程有自己的栈空间用于存储局部变量、函数调用信息和返回地址等。

上下文

上下文有哪些？怎么理解？

上下文通常包括栈指针（SP）、程序计数器（PC）和通用寄存器（如EAX、EBX等）等。它是保存和恢复程序执行状态的关键信息集合。通过保存和切换上下文，操作系统能够实现多任务调度、异常处理和进程间的切换等功能。

为什么会有上下文这种概念？

上下文的存在是为了保存和恢复程序的执行状态，在多任务操作系统中，可以在不同的任务之间进行切换，实现并发执行。上下文记录了当前任务的执行位置和环境，使得任务能够在中断、异常或切换时正确地恢复执行，保证了系统的正常运行和任务的无缝切换。

什么情况下进行用户态到内核态的切换？

用户态到内核态的切换发生在进行系统调用、异常处理和任务切换等情况下，通过切换上下文来实现。这种切换允许用户程序执行特权操作和访问受保护资源，以及保证系统的稳定和多任务的正常切换。

中断上下文代码中有哪些注意事项？

在中断上下文代码中需要注意的事项包括：尽量避免使用阻塞操作和长时间的计算，因为中断处理程序需要尽快完成以确保系统的响应性；对共享资源进行合适的同步和互斥操作，以防止并发访问导致的数据一致性问题。

请问线程需要保存哪些上下文，SP、PC、EAX这些寄存器是干嘛用的？

线程需要保存的上下文包括栈指针（SP）、程序计数器（PC）和通用寄存器（如EAX、EBX等）。栈指针用于管理函数调用和局部变量的内存空间，程序计数器指示当前执行的指令位置，而通用寄存器则用于存储临时数据和运算结果。这些上下文的保存和恢复实现了线程的暂停和继续执行。

并发和互斥

驱动里面为什么要有并发、互斥的控制？如何实现？

驱动程序中需要有并发和互斥的控制，主要是为了保护共享资源，防止并发访问带来的数据竞争和不一致性问题，确保驱动的正确性和可靠性。

实现可以通过信号量、互斥锁、自旋锁等同步机制进行。

自旋锁是什么？信号量是什么？二者有何异同？

自旋锁是一种轻量级的线程同步机制，线程在尝试获取锁时会一直自旋等待，不会主动放弃CPU执行权。

信号量是一种用于控制对共享资源的访问的计数器，线程需要获取信号量才能继续执行，如果计数器为0则线程会被阻塞，直到有其他线程释放信号量。

二者的异同点在于实现方式和适用场景：自旋锁适用于资源占用时间短、竞争激烈的情况，但会占用CPU资源；信号量适用于资源占用时间长、竞争不激烈的情况，线程在等待期间会被阻塞，不会占用CPU资源。

自旋锁和信号量可以睡眠吗？为什么？

自旋锁不会主动睡眠，因为它在尝试获取锁时一直忙等待（自旋），不会主动放弃CPU执行权。

信号量可以使线程睡眠，因为当线程请求获取信号量时，如果计数器为0，线程会被阻塞并进入睡眠状态，直到有其他线程释放信号量唤醒它。

自旋锁和信号量可以用于中断中吗？

自旋锁不适合在中断中使用，因为中断上下文中的代码执行不能被阻塞，自旋锁会导致中断无法正常响应。

信号量可以用于中断中。中断处理程序在需要访问资源时，会先检查信号量的状态，如果信号量被其他程序占用，中断处理程序就会等待。只有当其他程序释放信号量时，中断处理程序才能继续执行并访问资源。这样可以确保在中断期间对共享资源的安全访问。

读写锁是什么？

读写锁是一种并发控制机制，它允许多个线程同时读共享资源，但只允许一个线程写共享资源，通过提供更高的并发性来优化读操作和写操作的性能。

产生死锁的原因是什么？

死锁的原因是多个进程或线程互相持有彼此所需的资源，并且彼此等待对方释放资源，导致所有进程或线程都无法继续执行。

死锁的4个必要条件是什么？

死锁的四个必要条件是：互斥条件（资源独占性）、请求与保持条件（已获得资源的进程可以继续请求其他资源）、不可剥夺条件（已分配的资源不能被强制性收回）、循环等待条件（存在进程之间的资源循环等待）。

如何避免死锁？

为了避免死锁，可以使用以下方法：破坏死锁的四个必要条件之一，如避免循环等待、统一资源分配顺序；使用资源分配图或银行家算法进行资源的合理分配和管理。

死锁的处理方式有哪些？

死锁的处理方式包括预防、避免、检测和解除。

预防死锁通过破坏死锁的四个必要条件来防止死锁的发生；

避免死锁通过动态地分配资源，避免进入可能导致死锁的状态；

检测死锁则是定期检查系统的资源分配状态，一旦发现死锁，采取相应的措施进行恢复；

解除则是通过剥夺进程资源、回滚或重启等手段解除已经发生的死锁。

请问单核机器上写多线程程序，是否需要考虑加锁，为什么？

在单核机器上写多线程程序，确实需要考虑加锁。尽管在单核机器上只能同时执行一个线程，但当多个线程竞争共享资源时，仍然存在并发访问的问题。使用锁可以确保在任意时刻只有一个线程能够访问共享资源，避免数据竞争和不一致性的问题。此外，还可以利用锁来实现线程的同步和互斥。

内存

在1G内存的计算机中能否malloc(1.2G)？为什么？

malloc()函数申请的内存空间大小受限于物理内存的大小，因为它需要在物理内存中分配对应大小的连续内存块。

在1G内存的计算机中无，法直接使用malloc(1.2G)分配1.2G的内存空间，因为要分配的内存大于可用的内存大小，会导致内存分配失败。

malloc能申请多大的空间？

在理论上，malloc函数可以申请的空间大小取决于系统的限制和物理内存的大小。然而，在实际情况下，malloc能够成功申请的最大空间受到多个因素的限制，例如操作系统的限制、编译器的限制、可用内存的大小等。一般来说，32位系统上，malloc通常能够申请几十MB或者更大的空间，64位系统上，能够申请的空间更大，达到数TB甚至更多。但具体能够申请多大的空间还是要依赖于具体的环境和配置。