一.进程
1.什么是进程
在python程序中,想要实现多任务可以使用进程来完成,进程是实现多任务的一种方式.
2.进程的概念
一个正在运行的程序或者软件就是一个进程,它是操作系统进行资源分配的基本单位,也就是说每启动一个进程,操作系统都会给其分配一定的运行资源(内存资源)保证进程的运行。
3.进程的作用
多进程可以完成多任务,每个进程就好比一家独立的公司,每个公司都各自在运营,每个进程也在各自运行,执行各自的任务.
4.小结
1.进程使操作系统进行资源分配得基本单位
2.进程使python程序中实现多任务的一种方式
二.多进程的使用
1.导入进程包
#导入进程包
import multiprocessing
2.Process进程类的说明
Process([group [, target [, name [, args [, kwargs]]]]])
group:指定进程组,目前只能使用None
target:执行的目标任务名
name:进程名字
args:以元组方式给执行任务传参
kwargs:以字典方式给执行任务传参
Process创建的实例对象的常用方法:
start():启动子进程实例(创建子进程)
join():等待子进程执行结束
Process创建的实例对象的常用属性:
name:当前进程的别名,默认为Process-N,N为从1开始递增的整数
3.多进程完成多任务的代码
import multiprocessing
import time
# 跳舞任务
def dance():
for i in range(5):
print("跳舞中...")
time.sleep(0.2)
# 唱歌任务
def sing():
for i in range(5):
print("唱歌中...")
time.sleep(0.2)
if __name__ == '__main__':
# 创建跳舞的子进程
# target: 表示执行的目标任务名(函数名、方法名)
dance_process = multiprocessing.Process(target=dance)
sing_process = multiprocessing.Process(target=sing)
# 启动子进程执行对应的任务
dance_process.start()
sing_process.start()
4.小结
1.导入进程包
import multiprocessing
2.创建子进程并指定执行的任务
sub_process = multiprocessing.Process(target = 任务名)
3.启动进程执行任务
sub_process.start()
三.获取进程编号
1.获取进程编号的目的
获取进程编号的目的是验证主进程和子进程的关系,可以得知子进程是有哪个主进程创建出来的.
.获取当前进程编号
.获取当前父进程编号
2.获取当前进程编号
代码:
import multiprocessing
import time
import os
# 跳舞任务
def dance():
# 获取当前进程的编号
print("dance:", os.getpid())
# 获取当前进程
print("dance:", multiprocessing.current_process())
for i in range(5):
print("跳舞中...")
time.sleep(0.2)
# 扩展:根据进程编号杀死指定进程
os.kill(os.getpid(), 9)
# 唱歌任务
def sing():
# 获取当前进程的编号
print("sing:", os.getpid())
# 获取当前进程
print("sing:", multiprocessing.current_process())
for i in range(5):
print("唱歌中...")
time.sleep(0.2)
if __name__ == '__main__':
# 获取当前进程的编号
print("main:", os.getpid())
# 获取当前进程
print("main:", multiprocessing.current_process())
# 创建跳舞的子进程
# group: 表示进程组,目前只能使用None
# target: 表示执行的目标任务名(函数名、方法名)
# name: 进程名称, 默认是Process-1, .....
dance_process = multiprocessing.Process(target=dance, name="myprocess1")
sing_process = multiprocessing.Process(target=sing)
# 启动子进程执行对应的任务
dance_process.start()
sing_process.start()
3.获取当前父进程编号
os.getppiid()表示获取当前父进程编号
代码:
import multiprocessing
import time
import os
# 跳舞任务
def dance():
# 获取当前进程的编号
print("dance:", os.getpid())
# 获取当前进程
print("dance:", multiprocessing.current_process())
# 获取父进程的编号
print("dance的父进程编号:", os.getppid())
for i in range(5):
print("跳舞中...")
time.sleep(0.2)
# 扩展:根据进程编号杀死指定进程
os.kill(os.getpid(), 9)
# 唱歌任务
def sing():
# 获取当前进程的编号
print("sing:", os.getpid())
# 获取当前进程
print("sing:", multiprocessing.current_process())
# 获取父进程的编号
print("sing的父进程编号:", os.getppid())
for i in range(5):
print("唱歌中...")
time.sleep(0.2)
if __name__ == '__main__':
# 获取当前进程的编号
print("main:", os.getpid())
# 获取当前进程
print("main:", multiprocessing.current_process())
# 创建跳舞的子进程
# group: 表示进程组,目前只能使用None
# target: 表示执行的目标任务名(函数名、方法名)
# name: 进程名称, 默认是Process-1, .....
dance_process = multiprocessing.Process(target=dance, name="myprocess1")
sing_process = multiprocessing.Process(target=sing)
# 启动子进程执行对应的任务
dance_process.start()
sing_process.start()
main: 70860
main: <_MainProcess(MainProcess, started)>
dance: 70861
dance: <Process(myprocess1, started)>
dance的父进程编号: 70860
跳舞中...
sing: 70862
sing: <Process(Process-2, started)>
sing的父进程编号: 70860
唱歌中...
唱歌中...
唱歌中...
唱歌中...
唱歌中...
小结
1.获取当前进程编号
.os.getpid()
2.获取当前父进程编号
.os’.getppid()
3.获取进程编号可以查看父子进程的关系
四.进程执行带有参数的任务
1.进程执行带有参数任务的介绍
Process类执行任务并给任务传参数有两种方式
1.args 表示以元组的方式给执行任务传参
2.kwargs表示以字典方式给执行任务传参
2.args参数使用
代码:
import multiprocessing
import time
# 带有参数的任务
def task(count):
for i in range(count):
print("任务执行中..")
time.sleep(0.2)
else:
print("任务执行完成")
if __name__ == '__main__':
# 创建子进程
# args: 以元组的方式给任务传入参数
sub_process = multiprocessing.Process(target=task, args=(5,))
sub_process.start()
3.kwargs参数的使用
代码:
import multiprocessing
import time
# 带有参数的任务
def task(count):
for i in range(count):
print("任务执行中..")
time.sleep(0.2)
else:
print("任务执行完成")
if __name__ == '__main__':
# 创建子进程
# kwargs: 表示以字典方式传入参数
sub_process = multiprocessing.Process(target=task, kwargs={"count": 3})
sub_process.start()
4.小结
1进程执行任务并传参有两种方式
.元组方式传参(args):元组方式传参一定要和参数的顺序保持一致.
.字典方式传参(kwargs):字典方式传参字典中的key一定要和参数名保持一致.
五.守护进程
1.什么守护进程
设置守护主进程的目的是主进程退出子进程销毁,不让主进程再等待子进程去执行.
2.设置守护进程方式
子进程对象.daemon = True
代码
import time
from multiprocessing import Process
def run1():
print('run1')
time.sleep(1)
def run2():
print('run2')
time.sleep(2)
if __name__ == '__main__':
p1 = Process(target=run1)
p2 = Process(target=run2)
p1.daemon = True
p2.daemon = True
p1.start()
p2.start()
六.进程数据共享
1.进程间的数据不共享
代码
import time
from multiprocessing import Process
data = []
def run1():
data.append('run1')
def run2():
data.append('run2')
if __name__ == '__main__':
p1 = Process(target=run1)
p2 = Process(target=run2)
p1.start()
p2.start()
p1.join()
p2.join()
print(data)
2.进程间的数据共享的三种方式
1.管理器 manager
代码
from multiprocessing import Process, Manager
def run1(lis):
lis.append('run1')
def run2(lis):
lis.append('run2')
if __name__ == '__main__':
with Manager() as manager:
lis = manager.list()
p1 = Process(target=run1, args=(lis,))
p2 = Process(target=run2, args=(lis,))
p1.start()
p2.start()
p1.join()
p2.join()
print(lis)
2.队列 queue
代码
import time
from multiprocessing import Process, Queue
def run1(q):
q.put('run1')
time.sleep(1)
print('run1中获取:%s ' % q.get())
def run2(q):
print('run2中获取:%s ' % q.get())
q.put('run2')
if __name__ == '__main__':
q = Queue()
p1 = Process(target=run1, args=(q,))
p2 = Process(target=run2, args=(q,))
p1.start()
p2.start()
p1.join()
p2.join()
3.管道pipe
import time
from multiprocessing import Process, Pipe
def run1(obj1):
obj1.send('run1')
time.sleep(1)
print('run1中获取:%s ' % obj1.recv())
def run2(obj2):
print('run2中获取:%s ' % obj2.recv())
obj2.send('run2')
if __name__ == '__main__':
obj1, obj2 = Pipe()
p1 = Process(target=run1, args=(obj1,))
p2 = Process(target=run2, args=(obj2,))
p1.start()
p2.start()
p1.join()
p2.join()
七.进程池
1.为什么要采用进程池
当需要创建的子进程数量不多时,可以使用multiprocessing的Process动态生成多个进程,但是如果是上千个上百个,手动去创建的话就显得任务非常繁重,而且频繁的创建和销毁,会消耗非常大的资源,所以就可以用到multiprocessing模块提供的Pool方法.
2.设置进程池
初始化Pool时,可以指定一个做大进程数,当有新的请求提交到Pool中时,如果池还没有满,那么就会创建一个新的进程用来执行该请求;但如果进程池中的进程数量已经达到指定的最大值,那么该请求就会等待,直到池中有进程结束,才会创建新的进程来执行.
代码:
import os
import time
from multiprocessing import Pool
def worker(msg):
print("%s开始执行,进程号为%d" % (msg, os.getpid()))
time.sleep(1)
po = Pool(3) # 定义一个进程池,最大进程数3
for i in range(0, 10):
# Pool.apply_async(要调用的目标,(传递给目标的参数元祖,))
# 每次循环将会用空闲出来的子进程去调用目标
po.apply_async(worker, (i,))
po.close() # 关闭进程池,关闭后po不再接收新的请求
po.join() # 等待po中所有子进程执行完成,必须放在close语句之后