多任务-协程

一、协程的概念

协程,又称微线程,纤程。英文名Coroutine。
协程是python中另外一种实现多任务的方式,只不过比线程占用更小的执行单元(理解为需要的资源)。
通俗的理解:在一个线程中的某个函数,可以在任何地方保存当前函数的一些临时变量等信息,然后切换到另外一个函数中执行,注意不是通过调用函数的方式做到的,并且切换的次数以及什么时候再切换到原来的函数都由开发者自己确定。
在实现多任务时, 线程切换从系统层面远不止保存和恢复 CPU上下文这么简单。 操作系统为了程序运行的高效性每个线程都有自己缓存Cache等等数据,操作系统还会帮你做这些数据的恢复操作。 所以线程的切换非常耗性能。但是协程的切换只是单纯的操作CPU的上下文,所以一秒钟切换个上百万次系统都抗的住。

二、协程的实现方式

2.1 通过yield实现

# -*- coding:utf-8 -*-
import time

def work1():
    while True:
        print('--work1--')
        yield
        time.sleep(0.5)

def work2():
    while True:
        print('-work2')
        yield
        time.sleep(0.5)

def main():
    w1 = work1()
    w2 = work2()
    while True:
        next(w1)
        next(w2)

if __name__ == '__main__':
    main()

结果:
--work1--
-work2
--work1--
-work2
--work1--
-work2
--work1--
-work2
--work1--
-work2
--work1--
-work2
......

可以看到,任务1和任务2是交替执行的,实现了多任务。

2.2 通过greenlet实现

为了更好使用协程来完成多任务,python中的greenlet模块对其封装,从而使得切换任务变的更加简单。

使用如下命令安装greenlet模块:
sudo pip3 install greenlet

# -*- coding:utf-8 -*-

import time, random, greenlet

def test1(num):
    while True:
        print('A')
        print(num)
        gr2.switch(2)
        time.sleep(random.random())

def test2(num):
    while True:
        print('B')
        print(num)
        gr1.switch(1)
        time.sleep(random.random())

gr1 = greenlet.greenlet(test1)
gr2 = greenlet.greenlet(test2)

gr1.switch(1)

结果:
A
1
B
2
A
1
B
2
A
1
......

可以看到,同样实现了多任务,只不过是需要手动去切换任务。

2.3 通过gevent实现

greenlet已经实现了协程,但是还需要人工切换,python还有一个比greenlet更强大的并且能够自动切换任务的模块gevent。

其原理是当一个greenlet遇到IO(指的是input output 输入输出,比如网络、文件操作等)操作时,比如访问网络,就自动切换到其他的greenlet,等到IO操作完成,再在适当的时候切换回来继续执行。

由于IO操作非常耗时,经常使程序处于等待状态,有了gevent为我们自动切换协程,就保证总有greenlet在运行,而不是等待IO。

# -*- coding:utf-8 -*-
import gevent

def f(n):
    for i in range(n):
        print(gevent.getcurrent(), i)
        # 用来模拟一个耗时操作,注意不是time模块中的sleep
        gevent.sleep(1)

g1 = gevent.spawn(f, 5)
g2 = gevent.spawn(f, 5)
g3 = gevent.spawn(f, 5)

#把循环次数改为500000,让它们的运行时间长一点,然后在操作系统的进程管理器中看,线程数只有1个。
# g1 = gevent.spawn(f, 500000)
# g2 = gevent.spawn(f, 500000)
# g3 = gevent.spawn(f, 500000)

g1.join()
g2.join()
g3.join()

结果:
<Greenlet "Greenlet-0" at 0x10b8f0a48: f(5)> 0
<Greenlet "Greenlet-1" at 0x10b8f0d48: f(5)> 0
<Greenlet "Greenlet-2" at 0x10b8f0e48: f(5)> 0
<Greenlet "Greenlet-0" at 0x10b8f0a48: f(5)> 1
<Greenlet "Greenlet-1" at 0x10b8f0d48: f(5)> 1
<Greenlet "Greenlet-2" at 0x10b8f0e48: f(5)> 1
<Greenlet "Greenlet-0" at 0x10b8f0a48: f(5)> 2
<Greenlet "Greenlet-2" at 0x10b8f0e48: f(5)> 2
<Greenlet "Greenlet-1" at 0x10b8f0d48: f(5)> 2
<Greenlet "Greenlet-0" at 0x10b8f0a48: f(5)> 3
<Greenlet "Greenlet-1" at 0x10b8f0d48: f(5)> 3
<Greenlet "Greenlet-2" at 0x10b8f0e48: f(5)> 3
<Greenlet "Greenlet-0" at 0x10b8f0a48: f(5)> 4
<Greenlet "Greenlet-2" at 0x10b8f0e48: f(5)> 4
<Greenlet "Greenlet-1" at 0x10b8f0d48: f(5)> 4
# -*- coding:utf-8 -*-

from gevent import monkey; #monkey.patch_all() 这个方法需要放在最前面,不然会有警告
import gevent, random, time


#打补丁:有耗时操作时需要,自动检测耗时的操作,自动将time.sleep(random.random())转换为gevent.sleep(random.random())
# monkey.patch_all() # 将程序中用到的耗时操作的代码,换为gevent中自己实现的模块


def coroutine_work(coroutine_name):
    for i in range(10):
        print(coroutine_name, i)
        time.sleep(random.random())


gevent.joinall([
    gevent.spawn(coroutine_work, 'work1'),
    gevent.spawn(coroutine_work, 'work2')

])

结果:
work1 0
work1 1
work1 2
work1 3
work1 4
work1 5
work1 6
work1 7
work1 8
work1 9
work2 0
work2 1
work2 2
work2 3
work2 4
work2 5
work2 6
work2 7
work2 8
work2 9

三、进程、线程、协程对比

  • 进程是操作系统资源分配的单位;
  • 线程是CPU调度的单位;
  • 进程切换需要的资源最大,效率很低;
  • 线程切换需要的资源一般,效率一般(当然在不考虑GIL的情况下);
  • 协程切换任务资源很小,效率高;
  • 多进程、多线程根据cpu核数不一样可能是并行的,但是协程是在一个线程中,所以是并发。
### 关于多进程、多线程及协程的教学资源 在头歌实践教学平台上,对于多进程、多线程以及协程的学习资料主要集中在以下几个方面: #### Python中的多进程处理 Python的`multiprocessing`模块能够帮助开发者创建并管理子进程。此模块不仅允许程序并发执行任务,还提供了一系列工具来简化跨进程的数据交换和同步操作。例如,可以通过`Process`类启动新的进程,并利用`Queue`或`Pipe`实现进程间通信[^2]。 ```python from multiprocessing import Process, Queue def f(q): q.put([42, None, 'hello']) if __name__ == '__main__': queue = Queue() p = Process(target=f, args=(queue,)) p.start() print(queue.get()) # prints "[42, None, 'hello']" p.join() ``` #### Java中的多线程编程 Java语言内置了强大的多线程支持,使得编写并发应用程序变得相对简单。每条新创建的线程都对应着操作系统级别的实体,在不同的CPU核心上独立运行。然而值得注意的是,过多数量的活跃线程可能会引起性能下降,因为频繁发生上下文切换会消耗额外的时间成本[^1]。 ```java class MyThread extends Thread { public void run() { System.out.println(Thread.currentThread().getName()); } } public class Main { public static void main(String[] args) throws InterruptedException { new MyThread().start(); Thread.sleep(100); } } ``` #### 协程的应用场景 相较于传统的多线程方式,协程提供了更加灵活高效的解决方案。它们可以在同一个OS线程内协作式地轮流执行多个逻辑流,减少了因抢占调度而产生的开销。特别是在I/O密集型应用中,使用协程往往能带来显著的效率提升。 ```python import asyncio async def say_after(delay, what): await asyncio.sleep(delay) print(what) async def main(): task1 = asyncio.create_task(say_after(1, 'hello')) task2 = asyncio.create_task(say_after(2, 'world')) await task1 await task2 # 运行事件循环 asyncio.run(main()) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值