IO进程 day05

9. 进程

9. 9. 守护进程

守护进程的特点

  1. 后台进程
  2. 生命周期:从系统开始时开启,系统关闭时结束
  3. 脱离终端控制,周期执行的进程

守护进程创建步骤

1. 创建一个子进程,父进程退出,子进程变成孤儿进程,被init收养,此时变为后台进程(fork)
2. 在子进程中,创建一个新的会话,让子进程成为会话组的组长。为了让子进程完全脱离控制终端(srtsid)
3. 运行路径改为根目录,进程的运行路径不能被删除或卸载,增大子进程的权限(chdir)
4. 重设文件权限掩码,增大进程创建文件时的权限,提高灵活性(umask)
5. 关闭文件描述符,将不需要的文件描述符关闭(close)

示例

#include <stdio.h>
#include <unistd.h>

int main()
{
	pid_t pid = 0;
	
	// 创建子进程,父进程退出
	pid = fork();
	if(pid == EOF)
	{
		perror("fork err");
		return EOF;
	}
	if(pid == 0)
	{
		// 子进程
		// 创建会话组
		setsid();
		// 修改运行路径
		chdir("/");
		// 重设文件权限掩码
		umask(0);
		// 关闭文件描述符
		for(int i = 0; i < 3; i++)
			close(i);
		// 子进程不结束
		while(1);
	}
	else
	{
		exit(0);
	}
}

练习
练习:创建一个守护进程,循环间隔1s向文件中写入字符串 hello

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>

int main(int argc, char const *argv[])
{
	// 命令行判错
	if(argc != 2)
	{
		perror("argc err");
		return EOF;
	}
	
	pid_t pid = 0;
	int fd = -1;
	
	// 打开文件
	fd = open(argv[1], O_WRONLY | O_APPEND | O_CREAT, 0666);
	if(fd == -1)
	{
		perror("open err");
		return EOF;
	}
	
	// 创建子进程,父进程退出
	pid = fork();
	if(pid == EOF)
	{
		perror("fork err");
		return EOF;
	}
	if(pid == 0)
	{
		// 子进程
		// 创建会话组
		setsid();
		// 修改运行路径
		chdir("/");
		// 重设文件权限掩码
		umask(0);
		// 关闭文件描述符
		for(int i = 0; i < 3; i++)
			close(i);
		// 子进程不结束
		while(1)
		{
			sleep(1);
			write(fd, "hello\n", 6);
		}
	}
	else
	{
		exit(0);
	}
}

10. 线程

10.1. 线程的概念

 线程是一个轻量型的进程,为了提高系统的性能引入线程,线程和进程都参与CPU的调度

10.2. 进程和线程的区别

共性:都为操作系统提供并发执行的能力

不同点线程进程
资源和调度系统调度的最小单位资源分配的最小单位
地址空间同一个进程创建的所有
线程共享进程资源
地址空间相互独立
相互通信相对简单
全局变量即可实现
需要考虑临界资源
比较复杂
借助进程间的通信机制
安全性相对较差
进程结束时会导致所有线程退出
相对更安全

10.2. 线程资源

共享资源
 可执行的指令,静态的数据,进程中打开的文件描述符,信号处理函数。当前的工作目录,用户的ID,用户的组ID
私有资源
 线程ID (TID)、PC(程序计数器)和相关寄存器、堆栈、错误号 (errno)、信号掩码和优先级、执行状态和属性
线程标识
主线程的 TID 和 PID 是相同的,每个子线程有自己独立的 TID,但它们都共享相同的 PID

10.3. 线程的函数接口

1. pthread_create-创建线程

 #include <pthread.h>
int pthread_create(pthread_t  *thread, const pthread_attr_t *attr,void *(*start_routine) (void *), void *arg);

 功能:创建线程
 参数:
  pthread_t *thread:线程标识,成功创建线程后,pthread_create 会将新线程的 ID 写入 thread 指向的内存位置。
  const pthread_attr_t *attr:线程属性, NULL:代表设置默认属性
  void *(*start_routine):函数名,代表线程函数,指向一个函数的指针,这个函数就是线程的执行体(也就是线程的入口函数)。该函数必须符合 void *(*start_routine)(void *) 的原型,即接受一个 void * 类型的参数,并返回一个 void * 类型的值。
  void *arg:线程函数传递的参数,不传参为NULL
 返回值:成功返回0,失败更新errno

  1. CPU调度线程也是随机的
  2. 编译时需要加上-lpthread
    示例:
#include <stdio.h>
#include <pthread.h>
// 线程函数
void *pthreadFun(void *arg)
{
	printf("子线程结束\n");
}
int main()
{
	pthread_t tid = 0;
	// 创建线程
	if(pthread_create(&tid, NULL, pthreadFun, NULL))
	{
		printf("create err\n");
		return EOF;
	}
	printf("主线程执行……\n");
    sleep(2);
	printf("主线程执行结束\n");
	return 0;
}
  1. 传参
void *pthreadFun(void *arg)
{
	int num = *((int *)arg);
	printf("子线程结束\n");
}
int main()
{
	int a = 121;
	int *p = &a;
}
线程函数和普通函数的区别
  1. 普通函数是顺序执行的,手动调用函数,执行函数操作,线程函数在创建的线程中并发执行,不会影响主程序的运行。
  2. 普通函数同步执行,线程函数异步执行
  3. 存储位置不一样,普通函数存放在当前线程的栈区空间,线程函数共享进程的全局变量和堆空间。

2. pthread_exit

#include <pthread.h>
void pthread_exit(void *retval);

 功能:退出进程
 参数:void *retval任意类型数据,一般为NULL
 返回值:空

3.线程资源回收函数

#include <pthread.h>
int pthread_join(pthread_t thread, void **retval);

 功能:用于等待一个指定的线程结束,阻塞函数
 参数:
  thread:创建线程对象
  void **retval:指针*retval指向线程返回的参数,一般是NULL
 返回值:成功返回0,失败errno

#include <pthread.h>
int pthread_detach(pthread_t thread);

 功能:让线程结束时自动回收线程资源,让线程和主线程分离
 参数:pthread_t thread:线程ID
 返回值:成功返回0,失败EOF

join和detach的区别

在这里插入图片描述

获取线程号(pthread_self)

#include <pthread.h>
pthread_t pthread_self(void);

 功能:获取线程号
 参数:无
 返回值:成功返回线程ID

11. 线程间的通信机制

概念

 线程之间是很容易进行通信的,能够通过全局变量实现数据的共享和交换,也就是通过访问临界资源,但是多个线程在同时访问共享数据的对象时需要引入同步和互斥机制。
临界资源:一次只允许一个线程访问的资源叫临界资源

同步机制

 同步(synchronization)指的是多个任务(线程)按照约定的顺序相互配合完成一件事情

信号量

Linux中信号量分三类

  1. 内核信号量:由内核控制路径使用
  2. Posix信号量
     1. 无名信号量:存储在内存中,通常在线程间或父子进程间使用
    函数接口:sem_init\sem_wait\sem_post
     2. 有名信号量:存储在文件中,在进程间线程间都可以使用
    函数接口:sem_open\sem_wait\sem_post\sem_close
  3. System V信号量:是信号量的集合,叫信号灯集,属于IPC对象
    函数接口:semget\semctl\semop

无名信号量

 信号量:通过信号量实现同步操作,由信号量决定线程是继续运行还是阻塞等待。
 信号量代表的是某一类资源,它的值表示系统中该资源的数量,信号量>0的话,表示有资源可以使用,可以申请到资源,继续执行程序,信号量<= 0的话,表示没有资源可以使用,无法申请到资源,阻塞。
 信号量是一个受保护的量,只能通过函数接口访问
函数接口
初始化信号量:sem_init()
P操作,申请资源:sem_wait() 资源-1
V操作,释放资源:sem_post() 资源+1
注意:信号量是一个非负的整数,所以一定是 (>=0)

无名信号量函数接口

头文件

#include <semaphore.h>

sem_init()

#include <semaphore.h>
int  sem_init(sem_t *sem,  int pshared,  unsigned int value);

 功能:信号量初始化
 参数:
  sem_t *sem初始化的信号量
  int pshared信号量共享范围(0:线程间,1:进程间)
  unsigned int value信号量的初值
 返回值:成功0,失败EOF
sem_wait()

#include <semaphore.h>
int  sem_wait(sem_t *sem) 

 功能:申请资源,p操作
 参数:sem_t *sem信号量
 返回值:成功0,失败EOF
注意:函数执行时,信号量大于0,标识有资源可用;信号量为0时,表示没有资源可用,此时程序在此阻塞
sem_post()

#include <semaphore.h>
int  sem_post(sem_t *sem);

 功能:释放资源,V操作
 参数:sem_t *sem信号量
 返回值:成功0,失败EOF
sem_getvalue

 int sem_getvalue(sem_t *sem, int *sval);

 功能:获取信号量的值
 参数:
  sem_t *sem信号量对象
  int *sval信号量的值存放的变量(&)
 返回值:成功0,失败errno
sem_destroy

int sem_destroy(sem_t *sem);

 功能:销毁信号量
 参数:sem_t *sem信号量对象
 返回值:成功返回0,失败errno

互斥

 互斥:多个线程在访问临界资源时,同一时间只能一个线程进行访问

互斥锁

 互斥锁:通过互斥锁可以实现互斥机制,主要用来保护临界资源,每个临界资源都由一个互斥锁来保护,线程必须先获得互斥锁才能访问临界资源,访问完资源后释放该锁。

互斥锁的函数接口

pthread_mutex_init

int pthread_mutex_init(pthread_mutex_t  *mutex, pthread_mutexattr_t *attr);

 功能:初始化互斥锁
 参数:
  pthread_mutex_t *mutex互斥锁
  pthread_mutexattr_t *attr一般为NULL默认属性
 返回值:成功返回0,失败返回EOF
pthread_mutex_lock

int  pthread_mutex_lock(pthread_mutex_t *mutex);

 功能:申请互斥锁
 参数:pthread_mutex_t *mutex互斥锁
 返回值:成功返回0,失败返回EOF
pthread_mutex_unlock

int  pthread_mutex_unlock(pthread_mutex_t *mutex)

 功能:释放互斥锁
 参数:pthread_mutex_t *mutex互斥锁
 返回值:成功返回0,失败返回EOF
pthread_mutex_destroy

int  pthread_mutex_destroy(pthread_mutex_t  *mutex);

 功能:销毁互斥锁
 参数:pthread_mutex_t *mutex互斥锁
 返回值:成功返回0,失败返回EOF

条件变量

一般与互斥锁一起用,实现同步机制

条件变量函数接口

pthread_cond_init

int pthread_cond_init(pthread_cond_t *restrict cond,const pthread_condattr_t *restrict attr);

 功能:初始化条件变量
 参数:
  pthread_cond_t *restrict cond条件变量对象
  const pthread_condattr_t *restrict attr为NULL,默认变量
 返回值:成功:0 失败:非0
pthread_cond_wait

int pthread_cond_wait(pthread_cond_t *restrict cond,    pthread_mutex_t *restrict mutex);

 功能:等待信号的产生
 参数:
  pthread_cond_t *restrict cond条件变量对象
  pthread_mutex_t *restrict mutex互斥锁
 返回值:成功:0 失败:非0
注意:没有信号的时候函数会阻塞,同时解锁;等到条件产生,函数会结束结束阻塞同时上锁
pthread_cond_signal

int pthread_cond_signal(pthread_cond_t *cond);

 功能:产生条件变量信号
 参数:pthread_cond_t *cond条件变量
 返回值:成功:0,失败:非0
注意:一定要pthread_cond_wait先执行,再产生条件
pthread_cond_destroy

int pthread_cond_destroy(pthread_cond_t *cond);

 功能:将条件变量销毁
 参数:pthread_cond_t *cond条件变量
 返回值:成功:0,失败:非0

08-24
<think>首先,用户的问题是:“请问Linux系统中iowait过高如何解决”。这是一个关于Linux系统性能问题的查询,特别关注iowait过高的情况。 根据系统级指令: - 所有行内数学表达式必须使用$...$格式。 - 独立公式必须使用$$...$$格式并单独成段。 - LaTeX语法正确。 - 使用中文回答。 - 生成相关问题。 - 回答中引用的段落末尾自然地添加引用标识。 - 回答结构清晰,帮助用户逐步解决问题,保证回答真实可靠。 用户提供了几个引用,这些引用是关于iowait的: - 引用[1]: iowait 是系统上未完成的磁盘I/O请求的时间百分比。高值可能表示磁盘I/O瓶颈,但也可能受CPU、内存等因素影响。 - 引用[2]: 每天收到磁盘iowait告警,尤其是在日志服务器上进行大量读写操作,导致系统崩溃边缘。需要查找原因和优化点。 - 引用[3]: 从Cpu一行可以看到浪费在I/O Wait上的CPU百分比;数字越高,说明越多的CPU资源在等待I/O权限。 - 引用[4]: Linux系统磁盘IO过高排查总结,涉及Mysql服务器磁盘IO高。 - 引用[5]: mysql iowait高,iowait过高问题的查找及解决。 用户意图是了解或解决与系统I/O等待相关的问题。所以,我需要构建一个结构化的回答,帮助用户解决iowait过高的问题。 回答结构: 1. **理解iowait**:先解释什么是iowait,为什么它重要。 2. **排查步骤**:提供逐步的排查方法,包括工具和命令。 3. **常见原因**:列出导致iowait过高的常见原因。 4. **解决方案**:针对不同原因,给出解决方案。 5. **优化建议**:提供一般性的优化建议。 6. **生成相关问题**:在回答末尾添加相关问题。 在回答中,自然地添加引用标识。例如,当引用[1]时,在末尾添加[^1]。 确保使用中文。 现在,梳理关键点: - **iowait定义**:iowait 是CPU在等待I/O操作完成时处于空闲状态的时间百分比。高iowait表示系统在I/O上花费了大量时间,可能导致性能瓶颈。 - **工具**:使用如top, iostat, iotop, vmstat, sar等工具来监控和分析。 - **常见原因**: - 磁盘I/O瓶颈:磁盘速度慢或负载高。 - 内存不足:导致频繁的swap操作。 - 高I/O应用:如数据库、日志服务。 - 配置问题:如文件系统设置、调度算法。 - **解决方案**: - 识别高I/O进程:使用iotop或pidstat。 - 优化磁盘:使用SSD、RAID配置。 - 优化应用:如调整数据库配置。 - 增加内存:减少swap使用。 - 调整内核参数:如I/O调度器。 生成相关问题: - 基于主题,如:如何监控iowait?iowait与CPU使用率的关系?特定应用如MySQL的iowait优化? 回答大纲: 1. 介绍iowait及其重要性。 2. 逐步排查方法: - 监控整体系统状态。 - 识别高I/O进程。 - 检查磁盘性能。 - 分析内存使用。 - 检查应用配置。 3. 具体解决方案。 4. 总结。 5. 相关问题。 在回答中,引用用户提供的引用: - 当解释iowait时,引用[1]。 - 当提到告警和日志服务器时,引用[2]。 - 当讨论CPU等待时,引用[3]。 - 当涉及MySQL时,引用[4]和[5]。 确保回答真实可靠:基于Linux系统管理的标准知识。</think>### Linux系统中iowait过高的解决方案 iowait(I/O等待)是CPU在等待磁盘I/O操作完成时处于空闲状态的时间百分比,通常通过`top`或`iostat`命令查看。高iowait值(如超过20%)可能表示系统存在I/O瓶颈,导致性能下降甚至系统崩溃[^1]。常见原因包括磁盘速度不足、内存不足引发频繁swap、高I/O应用(如数据库或日志服务)配置不当等[^2][^4]。解决iowait过高需要系统性排查和优化。下面我将逐步指导您完成问题诊断和解决,确保过程清晰可靠。 #### 步骤1: 理解iowait并初步监控 iowait高并不总是磁盘问题,它可能受CPU处理能力、内存资源或应用负载的综合影响[^1]。首先,使用基础工具确认问题: - 运行 `top` 命令,查看CPU行中的 `wa` 值(即iowait百分比)。例如: ```bash top - 10:00:01 up 1 day, 1 user, load average: 5.2, 4.8, 4.5 %Cpu(s): 10.0 us, 5.0 sy, 0.0 ni, 70.0 id, 15.0 wa, 0.0 hi, 0.0 si, 0.0 st ``` 这里 `wa=15.0%` 表示iowait较高。如果此值持续偏高,说明系统在等待I/O[^3]。 - 使用 `vmstat 1 5` 命令(每秒采样一次,共5次),关注 `wa` 列和 `swap` 列。高 `wa` 伴随高 `si`(swap-in)或 `so`(swap-out)可能表示内存不足[^4]。 **关键点**:iowait高时,系统资源浪费在等待I/O权限上,需进一步定位源头[^3]。 #### 步骤2: 识别高I/O进程和磁盘 高iowait通常由特定进程或磁盘引起。使用以下工具深入分析: - **查找高I/O进程**:运行 `iotop`(需安装,`sudo apt-get install iotop` 或 `sudo yum install iotop`)。命令输出显示每个进程的磁盘读写速率,例如: ```bash sudo iotop -oP TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND 1028 be/4 root 0.00 B/s 0.00 B/s 0.00 % 15.00 % mysqld ``` 这里 `IO>` 列高的进程(如MySQL)可能是罪魁祸首[^5]。如果 `iotop` 不可用,使用 `pidstat -d 1` 替代。 - **检查磁盘性能**:运行 `iostat -dxk 1 5`,关注 `%util`(磁盘利用率)和 `await`(I/O平均等待时间)。例如: ```bash Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await %util sda 0.00 5.00 80.0 20.0 3200.0 800.0 50.00 10.00 100.00 90.00 ``` 如果 `%util > 70%` 且 `await` 高,说明磁盘过载,可能是慢速磁盘或RAID配置不当[^4]。 **常见原因**:日志服务器或数据库(如MySQL)的频繁读写是典型诱因,尤其在大量日志操作时[^2][^4]。 #### 步骤3: 分析系统资源瓶颈 iowait高可能源于内存或CPU问题: - **内存检查**:运行 `free -m` 查看内存使用。如果 `Swap` 使用率高(如 >10%),说明内存不足引发swap,间接推高iowait。优化方法: - 增加物理内存。 - 调整应用配置以减少内存需求(如MySQL的 `innodb_buffer_pool_size`)。 - **CPU和负载监控**:使用 `sar -u 1 5` 查看CPU使用率分布。高iowait伴随高 `%system` 可能表示内核处理I/O的CPU开销大。 #### 步骤4: 针对原因实施解决方案 根据排查结果,选择优化措施: - **优化高I/O应用**: - 如果是数据库(如MySQL),调整配置:增加 `innodb_io_capacity`、启用 `innodb_flush_log_at_trx_commit=2` 以减少磁盘写入频率[^5]。参考慢查询日志优化SQL语句。 - 如果是日志服务(如syslog或journald),限制日志大小:编辑 `/etc/systemd/journald.conf`,设置 `SystemMaxUse=500M`,或使用 `logrotate` 定期归档日志[^2]。 - **提升磁盘性能**: - 升级硬件:使用SSD替代HDD,或配置RAID 10提升I/O吞吐。 - 调整I/O调度器:运行 `echo deadline > /sys/block/sda/queue/scheduler`(将 `sda` 替换为您的磁盘),`deadline` 调度器适合高负载场景。 - **系统级优化**: - 减少swap使用:编辑 `/etc/sysctl.conf`,添加 `vm.swappiness=10`,然后运行 `sysctl -p`。 - 内核参数优化:增加文件句柄限制,在 `/etc/security/limits.conf` 中添加 `* soft nofile 65536` 和 `* hard nofile 65536`。 - **监控和告警**:部署工具如 `sar`(sysstat包)或Prometheus+Grafana,设置iowait阈值告警(如 >15%),便于早期干预[^2]。 #### 步骤5: 验证和预防 优化后,重新监控iowait: - 运行 `iostat 1` 和 `top`,确认 `wa` 值下降。 - 压力测试:使用 `fio` 工具模拟I/O负载(`sudo fio --name=test --ioengine=libaio --rw=randrw --bs=4k --numjobs=4 --size=1G --runtime=60`)。 预防措施包括: - 定期检查磁盘健康(`smartctl -a /dev/sda`)。 - 平衡负载:将高I/O应用分散到多台服务器。 #### 总结 iowait过高通常由磁盘瓶颈、内存不足或应用配置不当引起。通过工具监控、进程识别和针对性优化(如升级硬件或调整应用),能有效降低iowait。例如,某案例中优化MySQL参数后iowait从20%降至5%[^5]。记住,高iowait并非总是磁盘问题,需结合系统资源整体分析[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值