首先,在python中使用多线程时,其任意时刻只有一个线程在执行;
GIL的执行过程
(1).设置一个GIL;
(2).切换线程去准备执行任务(Runnale就绪状态);
(3). 运行;
(4). 可能出现的状态:
- 线程任务执行结束;
- time.sleep()
- 需要获取其他的信息才能继续执行(eg: 读取文件, 需要从网络下载html网页)
(5). 将线程设置为睡眠状态;
(6). 解GIL的锁;
Python的多线程在多核CPU上,只对于IO密集型计算产生正面效果;而当至少有一个CPU密集型线程存在,那么多线程效率会由于GIL而大幅下降。因为当其他核心上的线程被唤醒时,大部分情况下主线程已经又再一次获取到GIL了。这个时候被唤醒执行的线程只能白白的浪费CPU时间,看着另一个线程拿着GIL欢快的执行着。然后达到切换时间后进入待调度状态,再被唤醒,再等待,以此往复恶性循环。所以多线程的应用场景: I/O密集型(input, output)
不建议使用多线程的场景: 计算密集型(cpu一直占用),因为线程的改变只代表了 CPU 执行过程的改变。
import threading
from mytimeit import timeit
def job(li):
return sum(li)
@timeit
def use_thread():
li = range(1, 10001)
# create 5 threads
threads = []
for i in range(5):
t = threading.Thread(target=job, args=(li, ))
print(t)
t.start()
threads.append(t)
[thread.join() for thread in threads]
@timeit
def use_no_thread():
li = range(1, 10001)
for i in range(5):
job(li)
if __name__ == "__main__":
use_thread()
use_no_thread()