并发编程入门

并发python编程基础与实例

先验知识:
掌握操作系统的进程,线程异同之处。

  • 并发的应用场景
    1.减少处理特定任务的时间(爬虫缩短时间),提升速度。
    2.提升程序速度的常用4种方法:

在这里插入图片描述

本博客只研究多线程并发与多CPU并行的两种实现技术,不涉及多机器并行的大数据技术的实现方案。

  • Python对并发编程中的相应支持
    在这里插入图片描述

Python并发编程的三种方式

先验知识:什么是CPU的密集型计算,IO的密集型计算?
在这里插入图片描述

1.多线程
2.多进程
3.多协程
三者的关系与各自的优缺点:
在这里插入图片描述
注意GIL(全局解释器锁)将在后面进行补充。它也是使得Python不能使用多核CPU进行并发执行的罪魁祸首。
在这里插入图片描述
规避GIL的策略:
在这里插入图片描述

三种并发技术选型的原则流程图:
在这里插入图片描述
Python创建多线程:
在这里插入图片描述
以爬虫获取博客园为例,对比单线程与多线程的区别:
在这里插入图片描述
在这里插入图片描述
测试上述函数:
在这里插入图片描述

生产者消费者多线程爬虫模式

多组件的Pipeline技术架构
在这里插入图片描述
因为多组件的Pipeline技术架构就是一种生产者-消费者技术架构的原型,所以在这里作为先验知识进行相应的补充。

在这里插入图片描述
多线程数据通信所需的queue:
在这里插入图片描述

在上面的实例代码的基础上,进行改造,爬取每条博客的标题:
在这里插入图片描述
单线程版本的生产者-消费者爬虫实例:
在这里插入图片描述
craw函数作为生产者,parse作为消费者。

多线程版本的生产者-消费者爬虫实例:
在这里插入图片描述
调用处:
共设置三个生产者,两个消费者
在这里插入图片描述

显示效果:
在这里插入图片描述
02.data.txt内容:
在这里插入图片描述

线程安全

在这里插入图片描述
未加锁时直接导致银行亏损600元钱。

针对以上问题的应对解决方案Lock加锁:
在这里插入图片描述
以银行取钱的实例作为编程实例:
两个线程取800元钱同时:
下面是不加锁是导致的问题代码,因为cpu调度哪一个线程的时机是不确定的。尤其是在涉及项目中的远程调用和线程睡眠阻塞时,一定会产生意想不到的问题。
在这里插入图片描述
修改按照上面的加锁简化版with,先去产生一个Lock对象
在这里插入图片描述

线程池

线程池原理
在这里插入图片描述
线程池好处:
在这里插入图片描述
python中的线程池技术:ThreadPoolExecutor
在这里插入图片描述
右侧使用方法的as_completed是任务队列中先执行结束时才先输出,这一点与右侧的第一种结果遍历方案有所不同。

连接池技术属于concurrent.futures类库
改造原先的爬虫程序,可以得到url和html博客标题的对应关系

在这里插入图片描述

Web服务采用线程池的好处及架构

在这里插入图片描述
在这里插入图片描述
使用postman可以实现服务返回响应时间,在自己的项目开发中可以积累经验

原先需要600ms:
在这里插入图片描述
改造后:
全局建一个pool对象
在这里插入图片描述

在这里插入图片描述
至此多线程并发编程结束。

多进程并发编程

为什么需要?
在这里插入图片描述
使用api:
在这里插入图片描述

在这里插入图片描述
素数的判断程序
在这里插入图片描述
其余的函数设计(对比三种实现的方式):
在这里插入图片描述
在这里插入图片描述
注意多进程(CPU密集型计算)的实现需要与多线程方式进行代码的顺序调整。

异步IO

原理:在等待IO时再去干其他的事情,从而提高效率。
在这里插入图片描述
await对应io时刻:(第三方库需要在IO时不能发生阻塞)
在这里插入图片描述
最后执行task等待循环执行完成。

协程就是在异步IO中执行的函数。需要使用超级循环来进行调度:
在这里插入图片描述

异步IO中控制爬虫的并发度

防止把目标爬取网站爬取坏,超出处理能力。
用以初始化设置并发度的控制
用信号量semaphore:开始并发–;释放完成++

在这里插入图片描述
在先前的爬虫程序只需要修改为:
在这里插入图片描述

【【2021最新版】Python 并发编程实战,用多线程、多进程、多协程加速程序运行】 https://www.bilibili.com/video/BV1bK411A7tV/?share_source=copy_web&vd_source=f59db7cd21a530d0ec8fbe737a772750

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值