Python进阶:百万「并发」基础之异步编程(下篇)

本文深入探讨Python异步编程核心概念,包括asyncio库、协程、可等待对象及事件循环等,详解如何利用Python3.7简化异步编程。

Python进阶:百万「并发」基础之异步编程(下篇)

HackPython致力于有趣有价值的编程教学

简介

在上一节中,了解了yield、yield from等概念,此时Python以及具有编写协程实现「回调」的能力,而「回调」是异步编程的基础,随后Python语言的开发者利用yield from能力,在Python3.4中引入了异步I/O框架asyncio,该框架在Python3.5中被完善并作为标准库之一,用于基于协程的异步I/O编程,本节就来讨论一下asyncio以及async/await等内容。

关键概念

在Python3.4中引入了asyncio.coroutine装饰器来标志函数作为协程函数,协程函数具有协程的特性并与asyncio的事件循环一同使用,实现异步编程的目的,为了避免生成器与协程之间的混淆,在Python3.5中引入了async/await,其中async替代asyncio.coroutine装饰器,await替代yield from,从而让协程的实现更加直观,async/await和yield frome这两种不同风格的协程在底层其实是相互复用相互兼容的,在Python3.6中asyncio库“转正”,成为正式的标注库。

这里只讨论新的写法,即async/await实现协程的方式,Python中协程主要的特性如下:

?1.函数使用了async表达式开头,即使它不包含await表达式,也是一个协程函数
?2.async协程函数中使用yield或者yield from会阐释SyntaxError错误,即新旧语法不可混合使用
?3.与常规生成器类似,协程函数在调用时会返回一个coroutine对象
?4.与yield方式实现的协程不同,yield在最后会抛出Stoplteration异常,而async中则是RuntimeError
?5.当async创建的协程函数被垃圾回收时,一个未被await的协程会抛出RuntimeWarning异常。

在使用asyncio框架前,需要先了解其中几个概念。

Coroutine 协程

以async表达式开头的函数成为协程函数或简称为协程,如下:

import asyncio
async def main():
    print('hello')
    await asyncio.sleep(1)
    print('world')
asyncio.run(main())

上述代码中,main() 为协程函数,其写法是Python3.7的写法,Python3.7中对asyncio的使用做了简化,?如果你使用python3.6为主,其asyncio写法如下:

import asyncio
async def main():
    print('hello')
    await asyncio.sleep(1)
    print('world')

def run():
    # 创建协程对象
    coroutine = main()
    # 创建事件循环
    loop = asyncio.get_event_loop()
    # 将协程对象添加到事件循环中,运行直到结束
    loop.run_until_complete(coroutine)
    # 关闭事件循环
    loop.close()

run()

可以看出,Python3.6中asyncio的用法会复杂一下,在Python3.7中,run()方法已经为我们处理好了创建事件、添加协程对象到事件循环、关闭事件循环等事情?,即

loop asyncio.get_event_loop()
loop.run_until_complete(main())
loop.close()

# 在Python3.7中被替换为

asyncio.run()

当然,asyncio也支持传统的基于生成器的协程,不再多提。

Awaitables 可等待对象

「可等待对象」通常有3类,分别是:

?1.协程 coroutine
?2.任务 Task
?3.未来对象 Future

一个直观的判断方法就是,如果一个对象能够被用在 await 表达式中,那么就可以称这个对象为 「可等待对象」

简单示例如下:

import asyncio

async def myprint():
    print('hello hackpython')

async def main():
    # 直接调用,创建协程对象,不会执行协程中的内容
    myprint()
    # 协程对象成为被等待对象后,才会执行其中的内容
    await myprint()

asyncio.run(main())

上述代码会输出如下内容:

use_asyncio4.py:8: RuntimeWarning: coroutine 'myprint' was never awaited
  myprint()
RuntimeWarning: Enable tracemalloc to get the object allocation traceback

hello hackpython

从输入内容可以看出,直接使用协程函数是不会执行其中的逻辑的,而且还会因为没有使用而触发相应的警告,?只有利用await成为可等待对象后,才会被asyncio事件循环去执行。await会将控制权交由可等待对象。

Task 任务

「任务」主要用于「并发」的调度协程。

一个协程可以通过asyncio.create_task()函数封装成一个Task,此时这个协程很快就会被自动调度执行,代码如下:

import asyncio

async def fun1():
    print('hackpython')

async def main():
    # 创建任务
    task = asyncio.create_task(fun1())
    # 作为被等待对象
    await task

asyncio.run(main())

asyncio.create_task() 是 Python 3.7 新增的方法,如果是Python3.6还可以用 asyncio.ensure_future 和 loop.create_task?。

可以将Task理解为协程对象的进一步封装,其中包含着各种状态,简单使用如下:

async def a():
    print('a funtion start.')
    await  asyncio.sleep(2)
    print('a function end.')

async def main():
    # task = asyncio.ensure_future(a())
    task = asyncio.create_task(a())
    print(task)
    print(task.done())
    await task
    print(task)
    print(task.done())

if __name__ == '__main__':
    asyncio.run(main())

上述代码输出如下:

<Task pending coro=<a() running at /Users/ayuliao/Desktop/spider/lianjia/use_asyncio1.py:3>>
False
a funtion start.
a function end.
<Task finished coro=<a() done, defined at /Users/ayuliao/Desktop/spider/lianjia/use_asyncio1.py:3> result=None>
True

从输出内容可以看出,一开始Task任务的状态为pending(等待状态),调用其done()方法可以判断该任务是否执行?,可以看出,没有利用await将其转为可等待对象前,Task任务是没有执行的,使用await后,即将控制权交由task对象,此时再次打印,发现其状态改变为finshed(完成状态),调用done()方法后可得该任务被正常执行了?。

Future 未来对象

Future代表着一个未来对象,当异步操作结束后会将最终的结果设置到Future对象上,Future同样是对协程的封装,它是一个偏底层的类,具有比较多的方法可以做一些复杂的操作,但在日常开发时,并不会去使用?,更多的是使用其Task任务,它其实是Future的一个子类?。

Eventloop事件循环

使用 asyncio 框架时,其实就是开启一个事件循环,事件循环对应的实例提供了注册、取消、执行与回调等方法,方便控制整个事件循环实例。

所谓事件循环,就是将协程函数、任务 Task、未来对象 Future 等注册到事件循环中,事件循环实例会循环执行这些函数?,注意同一时刻下只执行某个函数对象,具体执行某个函数时,如果执行到函数中进行 I/O 耗时操作的部分,事件循环就会将该函数暂停,而去执行其他函数,等进行 I/O 耗时操作的函数执行完后,会再次加入循环队列,等事件循环下次循环到它时继续从此前位置执行,从而实现这些可异步操作对象的协同运行,达到并发的效果?。

结尾

asyncio是Python中比较复杂但又非常重要的概念,在 百万「并发」基础之异步编程 上、中、下三篇文章中比较系统的讨论了异步编程的概念以及在Python中的实现方式?,但对生成器、yield from以及asyncio等依旧没有深入探讨?,在HackPython后面的文章中,会系统性讨论这些概念,最后欢迎学习 HackPython 的教学课程并感觉您的阅读与支持。

??

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值