线程为计算机的最小调度单位,一个进程可能包含多个进程
各线程有各自的内存及命名空间,而线程之间共享内存,所以线程的开销比进程小
但是python由于GIL的存在,同一时间只能运行一个线程,所以python无法实现真正的多线程高并发,但是当应用为io型,系统的大部分时间都是在文件传输,而用在cpu计算的时间很小,这时候多线程还是不错的选择
当应用需要大量计算及为cpu密集型应用时,建议使用多进程
python进程创建使用threading类,使用方法和Process类很相似:
import threading
import time
import random
def GenThread(msg):
print("线程{}执行开始".format(msg))
print(threading.currentThread(),threading.currentThread().name,threading.currentThread().ident)
time.sleep(1)
print("线程{}执行结束".format(msg))
for i in range(100):
t = threading.Thread(None,target=GenThread,name=None,args=(i, ))
t.start()
time.sleep(1)
input()
python间线程通信比较简单,因为各个线程共享内存空间,直接操作全局变量
import threading
val = 0
def GenProcess1():
global val
for i in range(1000000):
val += 1
def GenProcess2():
global val
for i in range(1000000):
val += 1
t1 = threading.Thread(target=GenProcess1)
t2 = threading.Thread(target=GenProcess2)
t1.start()
t2.start()
print(val)
但是需要注意访问临界资源(即两个函数都会访问的资源)的问题 ,此时的结果并不是2000000,因为两个函数都在访问val,val+=1这句实际执行了读,加,赋值三个操作,可能两个函数同时进行到这里的时候重复了,所以导致结果与预期不一致,所以这里我们需要用到锁
import threading
val = 0
# 实例化锁对象
val_lock = threading.Lock()
def GenProcess1():
global val
for i in range(1000000):
val_lock.acquire()
val += 1
val_lock.release()
def GenProcess2():
global val
for i in range(1000000):
val_lock.acquire()
val += 1
val_lock.release()
t1 = threading.Thread(target=GenProcess1)
t2 = threading.Thread(target=GenProcess2)
t1.start()
t2.start()
t1.join()
t2.join()
print(val)
值得注意的是锁是用来锁代码的~当锁上时,后面的代码不会执行,当释放时才执行,至于访问锁哪段代码来限制访问临界区资源需要人来定义.