什么是python 中的协程
协程 (Coroutine),又称微线程,是一种比线程更轻量级的执行单元。你可以把它看作一个可以暂停和恢复执行的特殊函数。
协程不同于进程/线程, 并不是计算机中真实存在的组件, 你可以理解为python 程序员构建出来的逻辑组件, 它可以在python不同代码中切换执行, 而且方便地被程序员控制。
协程与进程,线程的区别
协程、线程和进程是实现并发的三个不同层次的概念,它们的主要区别如下:
| 特性 | 进程 (Process) | 线程 (Thread) | 协程 (Coroutine) |
|---|---|---|---|
| 基本单位 | 拥有独立资源(内存、文件)的执行单位 | 进程内的执行单位,共享进程资源 | 比线程更轻量级的执行单位,运行在线程之上 |
| 调度方式 | 由操作系统调度(抢占式) | 由操作系统调度(抢占式) | 由程序(事件循环)调度(协作式) |
| 资源开销 | 非常大,创建和切换成本高 | 较大,有独立的堆栈和上下文 | 极小,本质上是函数调用 |
| 数据共享 | 复杂,需要 IPC(如管道、队列) | 简单,直接共享内存,但需加锁保证安全 | 简单,在单线程内运行,无需加锁 |
| 并发能力 | 可利用多核 CPU | 受 GIL 限制,无法利用多核(CPU密集型) | 无法利用多核 CPU |
| 适用场景 | CPU 密集型任务 | I/O 密集型任务(有阻塞库时) | I/O 密集型任务(高并发、高性能) |
协程解决了什么问题
协程主要解决了以下两个核心问题:
-
高并发下的性能瓶颈:
对于 I/O 密集型应用(如 Web 服务器、爬虫),传统的多线程模型在并发量巨大时会遇到瓶颈。每创建一个线程,操作系统都需要分配相当大的内存资源,并且线程间的切换(上下文切换)也有显著的开销。当成千上万个连接同时存在时,线程模型会消耗大量系统资源,导致性能下降。
协程的解决方案:协程的开销极小,可以在单线程内轻松创建成千上万个协程。它们的切换由程序控制,几乎没有开销,从而能够以极低的成本实现超高并发。 -
异步编程的复杂性(回调地狱):
在协程出现之前,异步编程通常依赖于回调函数 (Callback)。这种模式很容易导致代码结构混乱,形成所谓的“回调地狱 (Callback Hell)”,代码难以阅读和维护。
协程的解决方案:async/await语法让异步代码看起来像同步代码一样直观、易于理解。它将回调的逻辑隐藏在语法糖背后,让开发者可以用线性的、顺序的思维来编写并发代码,极大地提升了可读性和可维护性。
协程与异步编程的关系
协程是异步编程的基石。
可以这样理解它们的关系:
- 异步编程是一种编程范式,其目标是允许程序在等待耗时操作(如 I/O)时能继续执行其他任务,以提高效率。
- 协程是实现这种范式的一种具体技术手段。
在现代 Python 中,asyncio 库就是异步编程的核心框架。这个框架的工作模式如下:
- 事件循环 (Event Loop) 是异步编程的“心脏”,它负责管理和调度所有的任务。
- 协程是事件循环处理的“任务单元”。你将一个个协程(通过
async def定义)提交给事件循环。 - 当一个协程执行到
await表达式时,它会暂停自己,并把控制权交还给事件循环。 - 事件循环会选择另一个已就绪的协程来执行。
- 当之前暂停的协程所等待的操作完成后,事件循环会在未来的某个时刻恢复它的执行。
因此,异步编程是通过事件循环来调度协程,从而实现在单线程内高效并发执行多个任务的编程模型。
192

被折叠的 条评论
为什么被折叠?



