【Python 3.5 async/await 入门指南】：掌握异步编程核心技能，提升代码效率

最新推荐文章于 2025-11-26 04:10:04 发布

原创最新推荐文章于 2025-11-26 04:10:04 发布 · 545 阅读

13 ·

CC 4.0 BY-SA版权

第一章：Python异步编程概述

Python异步编程是一种高效的编程范式，用于处理大量I/O密集型任务，如网络请求、文件读写和数据库操作。通过异步机制，程序可以在等待某些操作完成的同时执行其他任务，从而显著提升性能和资源利用率。

异步编程的核心概念

异步编程依赖于事件循环、协程和awaitable对象。事件循环负责调度任务，协程则是使用async def定义的特殊函数，能够在执行过程中暂停并让出控制权。

事件循环（Event Loop）：管理并运行所有异步任务
协程（Coroutine）：可暂停执行的函数，通过await关键字挂起
awaitable对象：包括协程、Task和Future，表示可等待的结果

一个简单的异步示例

import asyncio

async def fetch_data():
    print("开始获取数据")
    await asyncio.sleep(2)  # 模拟I/O操作
    print("数据获取完成")
    return {"data": 123}

async def main():
    task = asyncio.create_task(fetch_data())  # 创建任务
    print("执行其他操作...")
    result = await task  # 等待任务完成
    print(result)

# 运行异步主函数
asyncio.run(main())

上述代码中，fetch_data模拟了一个耗时的I/O操作。通过asyncio.create_task将其放入事件循环并发执行，主线程不会被阻塞。

同步与异步对比

特性	同步编程	异步编程
执行方式	顺序执行	并发调度
资源利用率	较低	较高
适用场景	CPU密集型	I/O密集型

第二章：async/await语法基础

2.1 理解协程与事件循环的核心概念

协程（Coroutine）是异步编程的基础单元，它允许函数在执行过程中暂停和恢复，从而实现高效的并发操作。与传统线程不同，协程由程序自身控制调度，开销更小，适合处理大量I/O密集型任务。

协程的定义与启动

在Python中，使用 async def 定义协程函数：

async def fetch_data():
    print("开始获取数据")
    await asyncio.sleep(2)
    print("数据获取完成")

上述代码中，await asyncio.sleep(2) 模拟非阻塞等待，期间事件循环可执行其他协程。调用该函数不会立即执行，而是返回一个协程对象，需由事件循环驱动运行。

事件循环的作用机制

事件循环是异步运行的核心，负责管理所有协程的调度。它持续监听I/O事件，并在适当时机切换协程执行上下文。

注册协程任务到循环中
检测哪些协程可以继续执行
处理回调、定时任务与异常

2.2 async def定义异步函数与调用实践

在Python中，使用`async def`关键字定义一个异步函数，该函数返回一个协程对象，可用于实现非阻塞的I/O操作。

基本语法与调用方式

async def fetch_data():
    print("开始获取数据...")
    await asyncio.sleep(2)
    return "数据完成"

# 调用异步函数需在事件循环中
import asyncio
result = asyncio.run(fetch_data())
print(result)

上述代码中，await asyncio.sleep(2)模拟耗时操作，期间释放控制权，允许其他任务运行。必须通过asyncio.run()启动事件循环执行协程。

常见调用模式对比

直接调用：fetch_data()返回协程对象，不会立即执行；
事件循环驱动：使用asyncio.run()或await触发执行；
并发执行：结合asyncio.gather()并行运行多个异步函数。

2.3 await关键字的使用规则与阻塞机制

await的基本使用规则

await关键字只能在标记为async的函数内部使用，用于暂停执行并等待Promise对象的解析。若在非异步函数中使用，将抛出语法错误。

执行流程与阻塞机制

遇到await时，JavaScript引擎会暂停当前函数的执行，直到Promise状态变更
尽管表现为“阻塞”，但实际是让出控制权，避免线程阻塞，保持事件循环正常运行
后续代码会被注册为Promise的then回调，实现非阻塞式等待

async function fetchData() {
  console.log("开始请求");
  const res = await fetch('/api/data'); // 暂停函数执行
  const data = await res.json();
  console.log("数据加载完成", data);
}

上述代码中，await确保fetch和json()按序完成，避免了嵌套回调。虽然函数暂停，但不会阻塞主线程，其他任务仍可执行。

2.4 异步上下文管理器与async with应用

异步上下文管理器是处理异步资源生命周期的关键工具，尤其适用于数据库连接、网络会话等需自动释放的场景。

基本语法与原理

通过定义 `__aenter__` 和 `__aexit__` 方法，对象可支持 `async with` 语句。事件循环在进入和退出时自动调用对应协程方法。

class AsyncDatabase:
    async def __aenter__(self):
        self.conn = await connect()
        return self.conn

    async def __aexit__(self, exc_type, exc_val, exc_tb):
        await self.conn.close()

# 使用方式
async with AsyncDatabase() as db:
    await db.execute("SELECT * FROM users")

上述代码中，`__aenter__` 建立连接并返回资源，`__aexit__` 确保连接关闭。即使执行中抛出异常，也能安全释放资源。

应用场景

异步文件读写操作
HTTP会话管理（如aiohttp.ClientSession）
数据库事务控制

2.5 错误处理：在异步函数中捕获异常

在异步编程中，常规的 try-catch 无法直接捕获 Promise 拒绝（rejection）或异步回调中的错误。必须通过特定机制进行处理。

使用 async/await 的异常捕获

async function fetchData() {
  try {
    const response = await fetch('/api/data');
    if (!response.ok) throw new Error('Network error');
    return await response.json();
  } catch (error) {
    console.error('Fetch failed:', error.message);
  }
}

该代码利用 try-catch 捕获异步操作中的异常。当 fetch 请求失败或响应不正常时，throw 会触发 catch 块，确保错误被妥善处理。

Promise 链中的错误处理

.then() 处理成功结果
.catch() 捕获链中任意环节的异常
避免“未处理的 promise rejection”警告

第三章：事件循环与任务调度

3.1 获取与运行事件循环的基本操作

在异步编程模型中，事件循环是核心调度机制。获取并启动事件循环是实现并发任务的基础步骤。

获取当前事件循环

每个线程可关联一个事件循环，通常通过 `get_event_loop()` 获取：

import asyncio

loop = asyncio.get_event_loop()

该方法返回当前上下文的默认事件循环实例。若未创建，将自动初始化一个。

运行事件循环

通过 `run_until_complete()` 启动循环并执行协程：

async def main():
    print("Hello, async world!")

loop.run_until_complete(main())

此调用会阻塞线程，直到协程执行完成。`main()` 被封装为任务加入事件队列，由循环调度执行。

首次调用时自动创建事件循环（如未存在）
循环持续监听 I/O 事件并触发回调
可通过 `close()` 释放资源

3.2 创建和管理Task对象实现并发执行

在Go语言中，通过goroutine与sync.WaitGroup结合可高效实现任务的并发执行。使用go关键字启动轻量级线程，实现函数的异步调用。

创建并发Task

func task(id int, wg *sync.WaitGroup) {
    defer wg.Done()
    fmt.Printf("执行任务 %d\n", id)
}
// 启动多个并发任务
var wg sync.WaitGroup
for i := 1; i <= 5; i++ {
    wg.Add(1)
    go task(i, &wg)
}
wg.Wait() // 等待所有任务完成

上述代码中，每轮循环启动一个goroutine执行task函数。WaitGroup确保主线程等待所有子任务结束。Add增加计数，Done减少计数，Wait阻塞至计数归零。

并发控制策略

避免无限制创建goroutine，防止资源耗尽
使用带缓冲的channel控制并发数量
合理设置超时机制，防止任务长时间阻塞

3.3 并发控制：gather与wait的对比与选择

在异步编程中，gather 与 wait 是两种常用的并发控制方式，适用于不同的任务调度场景。

功能差异分析

asyncio.gather：并发运行多个协程并收集结果，保持返回顺序；
asyncio.wait：等待协程集合完成，返回完成与未完成的集合，不保证顺序。

代码示例与说明


import asyncio

async def task(name, delay):
    await asyncio.sleep(delay)
    return f"Task {name} done"

async def main():
    # 使用 gather 获取有序结果
    results = await asyncio.gather(
        task("A", 1), task("B", 2)
    )
    print(results)  # ['Task A done', 'Task B done']

该代码通过 gather 并发执行任务并按调用顺序返回结果，适合需结果聚合的场景。而 wait 更适用于需细粒度控制任务生命周期的复杂调度。

第四章：异步编程实战案例

4.1 使用aiohttp实现异步HTTP请求

在高并发网络编程中，传统的同步HTTP请求方式容易造成资源阻塞。Python的`aiohttp`库结合`asyncio`提供了完整的异步HTTP客户端与服务器支持，显著提升IO密集型应用的吞吐能力。

基本用法示例

import aiohttp
import asyncio

async def fetch_data(session, url):
    async with session.get(url) as response:
        return await response.json()

async def main():
    async with aiohttp.ClientSession() as session:
        tasks = [
            fetch_data(session, "https://api.example.com/data/1"),
            fetch_data(session, "https://api.example.com/data/2")
        ]
        results = await asyncio.gather(*tasks)
    return results

asyncio.run(main())

该代码通过`ClientSession`复用连接，并发执行多个请求。`async with`确保资源安全释放，`asyncio.gather`并行调度任务，避免串行等待。

优势对比

特性	同步requests	异步aiohttp
并发性能	低（阻塞）	高（非阻塞）
资源占用	高（线程开销）	低（单线程协程）

4.2 异步文件读写操作的性能优化

在高并发场景下，异步文件读写操作的性能直接影响系统吞吐量。通过合理使用操作系统提供的异步I/O机制，如Linux的io_uring，可显著降低上下文切换开销。

使用io_uring提升I/O效率


struct io_uring ring;
io_uring_queue_init(64, &ring, 0);

struct io_uring_sqe *sqe = io_uring_get_sqe(&ring);
struct io_uring_cqe *cqe;

int fd = open("data.txt", O_RDONLY);
io_uring_prep_read(sqe, fd, buffer, sizeof(buffer), 0);
io_uring_submit(&ring);

io_uring_wait_cqe(&ring, &cqe);
// 处理完成事件
io_uring_cqe_seen(&ring, cqe);

上述代码初始化io_uring实例，准备异步读请求并提交至内核。相比传统aio，io_uring采用共享内存环形缓冲区，减少系统调用次数，提升批量I/O处理能力。

优化策略对比

策略	延迟	吞吐量
同步读写	高	低
标准AIO	中	中
io_uring	低	高

4.3 构建简单的异步爬虫应用

在高并发网络请求场景中，异步编程能显著提升爬虫效率。Python 的 `asyncio` 与 `aiohttp` 库结合，可轻松实现非阻塞 HTTP 请求。

核心依赖库

aiohttp：支持异步 HTTP 客户端/服务器框架
asyncio：Python 内置异步事件循环管理模块

异步爬虫示例代码

import asyncio
import aiohttp

async def fetch_page(session, url):
    async with session.get(url) as response:
        return await response.text()

async def main():
    urls = ["http://httpbin.org/delay/1"] * 5
    async with aiohttp.ClientSession() as session:
        tasks = [fetch_page(session, url) for url in urls]
        pages = await asyncio.gather(*tasks)
    print(f"成功获取 {len(pages)} 个页面")

上述代码中，fetch_page 函数使用会话对象并发请求 URL，asyncio.gather 并行调度所有任务，避免逐个等待响应，极大提升抓取速度。

4.4 异步数据库操作初步（基于aiosqlite）

在异步Web应用中，数据库I/O可能成为性能瓶颈。使用 aiosqlite 可以将SQLite的阻塞调用封装为协程，实现非阻塞的数据访问。

安装与基本用法

首先通过pip安装：

pip install aiosqlite

异步CRUD示例

以下代码展示如何创建表并插入数据：

import aiosqlite
import asyncio

async def init_db():
    async with aiosqlite.connect("test.db") as db:
        await db.execute("CREATE TABLE IF NOT EXISTS users (id INTEGER PRIMARY KEY, name TEXT)")
        await db.execute("INSERT INTO users (name) VALUES (?)", ("Alice",))
        await db.commit()

该函数使用 async with 确保连接自动关闭，execute 和 commit 均为awaitable操作，避免主线程阻塞。

aiosqlite将SQLite的同步接口包装为异步协程
适用于轻量级项目或原型开发
不支持多线程并发写入，需注意锁机制

第五章：总结与进阶学习建议

持续构建项目以巩固技能

真实世界的项目经验远胜于理论学习。建议每掌握一个核心技术点后，立即投入小型实践项目。例如，在掌握 Go 语言的并发模型后，可尝试构建一个简单的并发爬虫：


package main

import (
    "fmt"
    "net/http"
    "sync"
)

func fetch(url string, wg *sync.WaitGroup) {
    defer wg.Done()
    resp, err := http.Get(url)
    if err != nil {
        fmt.Printf("Error fetching %s: %v\n", url, err)
        return
    }
    defer resp.Body.Close()
    fmt.Printf("Fetched %s with status %s\n", url, resp.Status)
}

func main() {
    var wg sync.WaitGroup
    urls := []string{
        "https://httpbin.org/get",
        "https://httpstat.us/200",
        "https://httpstat.us/404",
    }

    for _, url := range urls {
        wg.Add(1)
        go fetch(url, &wg)
    }
    wg.Wait()
}