Python并发之协程基础(4)

本文介绍了协程的基本概念,对比了协程与线程的区别,并探讨了协程的优缺点。通过yield和greenlet库展示了如何实现协程,还讲解了gevent库在协程中的应用,强调了gevent的三大价值。最后,通过生产者/消费者模型的示例,加深了对协程理解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

1, 基本概念

协程,又称微线程,纤程。英文名Coroutine。一句话说明什么是线程:协程是一种用户态的轻量级线程

我觉得单说协程,比较抽象,如果对线程有一定了解的话,应该就比较好理解了。

那么这么来理解协程比较容易:

  线程是系统级别的,它们是由操作系统调度;协程是程序级别的,由程序员根据需要自己调度。我们把一个线程中的一个个函数叫做子程序,那么子程序在执行过程中可以中断去执行别的子程序;别的子程序也可以中断回来继续执行之前的子程序,这就是协程。也就是说同一线程下的一段代码<1>执行着执行着就可以中断,然后跳去执行另一段代码,当再次回来执行代码块<1>的时候,接着从之前中断的地方开始执行。

比较专业的理解是:

  协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈。因此:协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状态,换种说法:进入上一次离开时所处逻辑流的位置。

协程的优点:

  (1)无需线程上下文切换的开销,协程避免了无意义的调度,由此可以提高性能(但也因此,程序员必须自己承担调度的责任,同时,协程也失去了标准线程使用多CPU的能力。线程数量越多,协程的性能优势就越明显。

  (2)无需原子操作锁定及同步的开销。协程不需要多线程的锁机制,因为只有一个线程,也不存在同时写变量冲突,在协程中控制共享资源不加锁,只需要判断状态就好了,所以执行效率比多线程高很多。

  (3)方便切换控制流,简化编程模型

  (4)高并发+高扩展性+低成本:一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理。

协程的缺点:

  (1)无法利用多核资源:协程的本质是个单线程,它不能同时将 单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU上.当然我们日常所编写的绝大部分应用都没有这个必要,除非是cpu密集型应用。

  (2)进行阻塞(Blocking)操作(如IO时)会阻塞掉整个程序

2 , 协程实现

传统的生产者-消费者模型是一个线程写消息,一个线程取消息,通过锁机制控制队列和等待,但一不小心就可能死锁。

以下协程方式实现,利于我们循序渐进的理解协程。

通过yield实现协程

前文所述“子程序(函数)在执行过程中可以中断去执行别的子程序;别的子程序也可以中断回来继续执行之前的子程序”,那么很容易想到Python的yield,显然yield是可以实现这种切换的。

使用yield实现协程操作例子:

def consumer(name):
    print("准备开始消费数据")
    while True:
        print("\033[31;1m[consumer] {}\033[0m ".format(name))
        data = yield
        print("{} 正在处理数据: {}".format(name, data))

def producer(obj1, obj2):
    obj1.send(None)   # 启动obj1这个生成器,第一次必须用None  <==> obj1.__next__()
    obj2.send(None)   # 启动obj2这个生成器,第一次必须用None  <==> obj2.__next__()
    n = 0
    while n < 2:
        n += 1
        print("\033[32;1m[producer]\033[0m 正在生产数据 {}".format(n))
        obj1.send(n)
        obj2.send(n)

if __name__ == "__main__":
    print("main process begin")
    con1 = consumer("消费者1") #代码执行到此处时调用consumer函数,遇到yield这一行时跳出函数;继续执行主函数【con2 = consumer("消费者2")】
    con2 = consumer("消费者2") #在这一行同样调用consumer函数,遇到yield这一行跳出函数,继续执行主函数下一行【producer(con1, con2)】
    
    producer(con1, con2) 
    '''进入producer函数,【obj1.send(None)】【和obj2.send(None)】分别启动两个生成器,
    代码执行到【obj1.send(n)】这一行时回到consumer函数的yield位置,并将send过来的数据n赋值给data变量,
    然后继续执行consumer函数的余下代码【print("{} 正在处理数据: {}".format(name, data))】。
    
    执行完print以后,循环还没有退出,继续执行【print("\033[31;1m[consumer] {}\033[0m ".format(name))】之后,
    再次遇到yield跳转到之前的位置执行【obj2.send(n)】,这一行又是跳转到consumer函数,
    send过来的数据n给到data后继续执行consumer函数的余下代码【print("{} 正在处理数据: {}".format(name, data))】。
    
    执行完print以后,循环还没有退出,继续余下的代码。直到整个循环结束
    
    '''

输出如下:

main process begin
准备开始消费数据
[consumer] 消费者1 
准备开始消费数据
[consumer] 消费者2 
[producer] 正在生产数据 1
消费者1 正在处理数据: 1
[consumer] 消费者1 
消费者2 正在处理数据: 1
[consumer] 消费者2 
[producer] 正在生产数据 2
消费者1 正在处理数据: 2
[consumer] 消费者1 
消费者2 正在处理数据: 2
[consumer] 消费者2 

greenlet实现协程

yield能实现协程,不过实现过程不易于理解,greenlet是在这方面做了改进。

Python的 greenlet就相当于手动切换,去执行别的子程序,在“别的子程序”中又主动切换回来。greenlets之间切换通过调用greenlet的switch()方法,在这种情况下,执行点跳转到调用switch()的greenlet,当一个greenlet挂点时,执行点会跳到其父greenlet。在切换的时候,一个对象或者异常可以传到目标greenlet,这可以很方便的用来在greenlet之间传递信息

代码如下:

from greenlet import greenlet
import time
def productor():
    n = 0
    while n < 2:
        n += 1
        print("\033[32;1m[producer]\033[0m 正在生产数据 {}".format(n))
        c.switch(n)  # 切换到c 并传了一个参数item
        time.sleep(1)

def consumer():
    while True:
        data = p.switch() # 切换到p 在恢复的时候接收数据
        print("\033[31;1m[consumer] {}\033[0m ".format(data))

if __name__ == '__main__':
    c = greenlet(consumer) #将一个普通函数变成协程
    p = greenlet(productor)
    c.switch() #进入消费者函数执行,到yield后进入暂停状态,只有恢复时才能接收数据

输出如下:

[producer] 正在生产数据 1
[consumer] 1 
[producer] 正在生产数据 2
[consumer] 2 

gevent实现协程

gevent的基本原理来自于libevent&libev。熟悉c语言的同学对这么一个lib应该不陌生。本质上libevent或者说libev都是一种事件驱动模型。这种模型对于提高cpu的运行效率,增强用户的并发访问非常有效。但是因为它本身是一种事件机制,所以写起来有点绕,不是很直观。所以,为了修正这个问题,有心人引入了用户侧上下文切换的机制。这就是说,如果代码中引入了带io阻塞的代码时,lib本身会自动完成上下文的切换,全程用户都是没有觉察的。这就是gevent的由来。

gevent模块:

  • gevent是在greenlet的基础上进行封装使得gevent变得更加的易用。

  • gevent采用了隐式启动事件循环,即在需要阻塞的时候开启一个专门的协程来启动事件循环;

  • 如果一个任务没有io操作,那么他会一直执行直到完成;其他协程没有执行的机会;

  • 自动识别io事件,放弃CPU控制时间;

gevent 的价值:
价值一: 使用基于 epoll 的 libev 来避开阻塞
价值二: 使用基于 gevent 的 高效协程 来切换执行
价值三: 只在遇到阻塞的时候切换,没有轮需的开销,也没有线程的开销

示例代码:

import gevent

def func1():
    print("func1 running")
    gevent.sleep(1)             # 内部函数实现io操作
    print("switch func1")

def func2():
    print("func2 running")
    gevent.sleep(1)
    print("switch func2")

def func3():
    print("func3  running")
    gevent.sleep(1)
    print("func3 done..")

gevent.joinall([gevent.spawn(func1),
                gevent.spawn(func2),
                gevent.spawn(func3),
                ])

输出:

func1 running
func2 running
func3  running
switch func1
switch func2
func3 done..

生产者/消费者模型示例:

import gevent
from gevent import monkey
monkey.patch_all()
from gevent.queue import Queue

queue = Queue()

def productor(queue):
    n = 0
    while n < 2:
        n += 1
        print("\033[32;1m[producer]\033[0m 正在生产数据 {}".format(n))
        queue.put(n)
        gevent.sleep(2)

def consumer(queue):
    while True:
        if not queue.empty():
            data = queue.get()
            print("\033[31;1m[consumer] {}\033[0m ".format(data))
        gevent.sleep(1)

if __name__ == '__main__':
    p = gevent.spawn(productor, queue)
    c = gevent.spawn(consumer, queue)
    p.join()
    c.join()

输出:

[producer] 正在生产数据 1
[consumer] 1 
[producer] 正在生产数据 2
[consumer] 2 

参考文献:

https://softlns.github.io/2015/11/28/python-gevent/

https://www.cnblogs.com/zingp/p/5911537.html

https://www.cnblogs.com/woaixuexi9999/p/9356677.html

https://www.cnblogs.com/piperck/p/5650167.html

### 回答1: 你可以使用 asyncio 库中的 async 和 await 关键字来运行协程。 例如: ```python import asyncio async def my_coroutine(param): # 协程函数体 result = do_something(param) return result async def main(): # 在主函数中运行协程 result = await my_coroutine(42) print(result) # 运行主函数 asyncio.run(main()) ``` 你也可以使用 asyncio.gather() 函数来同时运行多个协程,并获取它们的返回值: ```python import asyncio async def my_coroutine_1(param): # 协程函数体 result = do_something(param) return result async def my_coroutine_2(param): # 协程函数体 result = do_something_else(param) return result async def main(): # 并发运行协程 results = await asyncio.gather( my_coroutine_1(42), my_coroutine_2(43), ) print(results) # 运行主函数 asyncio.run(main()) ``` 在上面的示例中, my_coroutine_1 和 my_coroutine_2 会同时运行,并在它们都完成后,将它们的返回值放在一个列表中返回。 ### 回答2: 在Python中,我们可以使用协程(Coroutine)来实现并发运行并获取返回值。协程是一种轻量级的线程,可以在运行过程中暂停和恢复,可以在一个线程中执行多个任务,实现并发效果。 使用Python的asyncio库可以轻松实现协程并发运行协程的方式有多种,以下是其中一种常见的方式,使用asyncio.gather()函数来同时运行多个协程,并获取其返回值。 首先,我们需要定义多个协程函数,这些函数可以是普通函数加上@asyncio.coroutine装饰器,也可以是async def定义的异步函数。这些协程函数可以是耗时的任务,如网络请求、IO读写等。 然后,我们使用asyncio.gather()函数并发运行这些协程函数,该函数接受一个或多个协程对象作为参数,并返回一个包含所有协程返回值的列表。 最后,我们可以使用事件循环(Event Loop)来运行整个程序,并获取协程函数的返回值。事件循环是协程并发运行的引擎,负责调度和执行协程任务。 以下是一个示例代码: import asyncio # 定义协程函数 async def coro1(): return "Hello" async def coro2(): return "World" # 创建事件循环 loop = asyncio.get_event_loop() # 并发运行多个协程 tasks = [coro1(), coro2()] results = loop.run_until_complete(asyncio.gather(*tasks)) # 打印结果 print(results) 在上述示例代码中,我们定义了两个协程函数coro1()和coro2(),分别返回"Hello"和"World"。然后,我们在事件循环中使用asyncio.gather()函数并发运行这两个协程函数,并将返回值存储在results列表中。最后,我们打印出结果。 通过这种方式,我们可以方便地实现Python中的协程并发运行,并获取其返回值。这种方式非常适合处理并发任务,提高程序的效率。 ### 回答3: Python中的协程是一种轻量级的并发编程方式,可以在单线程中同时运行多个任务,提高程序的执行效率。在Python中有许多支持协程的库,如asyncio和gevent。下面是使用asyncio库实现并发运行协程并获取返回值的步骤: 1. 首先,导入asyncio库和相应的模块。创建一个asyncio的事件循环对象。 2. 接下来,定义一个协程函数,使用async关键字声明。在协程函数中编写你的业务逻辑代码,并使用await关键字等待异步任务完成。 3. 在主函数中,使用asyncio的gather()函数来运行多个协程任务。将协程任务作为gather()函数的参数传入,以创建一个任务列表。 4. 调用事件循环对象的run_until_complete()方法,将任务列表作为参数传入,执行任务。 5. 在run_until_complete()方法返回后,可以通过调用协程对象的result()方法来获取协程任务的返回值。result()方法是一个属性,如果任务成功完成,它将返回任务的结果。 下面是一个简单的示例代码: ```python import asyncio async def task(name): # 模拟耗时任务 await asyncio.sleep(1) return f"Hello, {name}" async def main(): tasks = [task("Alice"), task("Bob") ] results = await asyncio.gather(*tasks) for result in results: print(result) if __name__ == "__main__": loop = asyncio.get_event_loop() loop.run_until_complete(main()) ``` 在上面的示例中,定义了一个名为task的协程函数,它会模拟一个耗时任务并返回一个字符串。main()函数中创建了两个任务,并使用asyncio.gather()将它们组合成一个任务列表。最后通过循环打印出每个任务的返回值。 运行以上代码,你将看到类似如下输出: ``` Hello, Alice Hello, Bob ``` 这是两个协程任务返回的结果。这里使用asyncio库实现协程并发运行并获取返回值,不同的库和框架可能具有类似或不同的方式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值