环境:win7+python2.7
一直想学习多进程或多线程,但之前只是单纯看一点基础知识还有简单的介绍,无法理解怎么去应用,直到前段时间看了github的一个爬虫项目涉及到多进程,多线程相关内容,一边看一边百度相关知识点,现在把一些相关知识点和一些应用写下来做个记录.
首先说下什么是进程:进程是程序在计算机上的一次执行活动,当运行一个程序的时候,就启动了一个进程.而进程又分为系统进程和用户进程.只要是用于完成操作系统的各种功能的进程就是系统进程,它们就是处于运行状态下的操作系统本身;而所有由你启动的进程都是用户进程。进程是操作系统进行资源分配的单位。
直观点说,在任务管理器的用户名上标明system的是系统进程,标明administrator的是用户进程,另外net是网洛,lcacal service是本地服务,关于进程更加具体的信息可以百科,这里得省点力气,不然收不回了.
一.多进程的简单使用
如图,multiprocessing有多个函数,很多我也还没去了解,这里只讲我目前了解的.
进程创建:Process(target=主要运行的函数,name=自定义进程名称可不写,args=(参数))
方法:is_alive():判断进程是否存活
join([timeout]):子进程结束再执行下一步,timeout为超时时间,有时进程遇到阻塞,为了程序能够运行下去而设置超时时间
run():如果在创建Process对象的时候不指定target,那么就会默认执行Process的run方法
start():启动进程,区分run()
terminate():终止进程,关于终止进程没有这么简单,貌似用psutil包会更好,有机会以后了解更多再写下。
其中,Process以start()启动某个进程。
属性:authkey: 在文档中authkey()函数找到这么一句话:Set authorization key of process设置过程的授权密钥 ,目前没找到相关应用实例,这个密钥是怎么用的呢?文章不提
daemon:父进程终止后自动终止,且自己不能产生新进程,必须在start()之前设置
exitcode:进程在运行时为None、如果为–N,表示被信号N结束
name:进程的名字,自定义
pid:每个进程有唯一的PID编号。
1.Process(),start(),join()
# -*- coding:utf-8 -*-
from multiprocessing import Process
import time
def fun1(t):
print 'this is fun1',time.ctime()
time.sleep(t)
print 'fun1 finish',time.ctime()
def fun2(t):
print 'this is fun2',time.ctime()
time.sleep(t)
print 'fun2 finish',time.ctime()
if __name__ == '__main__':
a=time.time()
p1=Process(target=fun1,args=(4,))
p2 = Process(target=fun2, args=(6,))
p1.start()
p2.start()
p1.join()
p2.join()
b=time.time()
print 'finish',b-a
这里一共开了两个进程,p1和p2,arg=(4,)中的4是fun1函数的参数,这里要用tulpe类型,如果两个参数或更多就是arg=(参数1,参数2…),之后用start()启动进程,我们设置等待p1和p2进程结束再执行下一步.来看下面的运行结果,fun2和fun1基本在同一时间开始运行,当运行完毕(fun1睡眠4秒,同时fun2睡眠6秒),才执行print ‘finish’,b-a语句
this is fun2 Mon Jun 05 13:48:04 2017
this is fun1 Mon Jun 05 13:48:04 2017
fun1 finish Mon Jun 05 13:48:08 2017
fun2 finish Mon Jun 05 13:48:10 2017
finish 6.20300006866
Process finished with exit code 0
我们再来看下start()与join()处于不同位置会发生什么
# -*- coding:utf-8 -*-
from multiprocessing import Process
import time
def fun1(t):
print 'this is fun1',time.ctime()
time.sleep(t)
print 'fun1 finish',time.ctime()
def fun2(t):
print 'this is fun2',time.ctime()
time.sleep(t)
print 'fun2 finish',time.ctime()
if __name__ == '__main__':
a=time.time()
p1=Process(target=fun1,args=(4,))
p2 = Process(target=fun2, args=(6,))
p1.start()
p1.join()
p2.start()
p2.join()
b=time.time()
print 'finish',b-a
结果:
this is fun1 Mon Jun 05 14:19:28 2017
fun1 finish Mon Jun 05 14:19:32 2017
this is fun2 Mon Jun 05 14:19:32 2017
fun2 finish Mon Jun 05 14:19:38 2017
finish 10.1229999065
Process finished with exit code 0
看,现在是先运行fun1函数,运行完毕再运行fun2接着再是print ‘finish’,即先运行进程p1再运行进程p2,感受到join()的魅力了吧.现在再试试注释掉join()看看又会出现什么
# -*- coding:utf-8 -*-