Python基础教程（九十六）异步IO：Python异步IO，解锁百万并发的新姿势

Python异步IO：解锁百万并发新姿势

最新推荐文章于 2025-11-24 15:28:47 发布

原创最新推荐文章于 2025-11-24 15:28:47 发布 · 232 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#python #php #数据库

Python基础教程专栏收录该内容

99 篇文章

订阅专栏

深度解析Python异步IO：从原理到百万并发实战

异步IO的核心：事件循环与协程

异步IO的核心是一个事件循环（Event Loop）。它持续监听并处理I/O事件（如网络响应、文件读写完成），当某个任务需要等待I/O时，事件循环会挂起该任务，转而执行其他就绪任务，实现单线程内的高并发。

协程（Coroutine） 是异步执行的基本单位，通过async def定义。使用await关键字挂起协程，将控制权交还事件循环，待I/O完成后再恢复执行。

import asyncio

async def fetch_data(url):
    print(f"开始请求: {url}")
    await asyncio.sleep(2)  # 模拟网络I/O等待
    print(f"完成请求: {url}")
    return f"{url}的数据"

async def main():
    # 创建3个并发任务
    tasks = [
        asyncio.create_task(fetch_data("https://api1.com")),
        asyncio.create_task(fetch_data("https://api2.com")),
        asyncio.create_task(fetch_data("https://api3.com"))
    ]
    results = await asyncio.gather(*tasks)  # 等待所有任务完成
    print("所有结果:", results)

# 运行事件循环
asyncio.run(main())

性能对比：异步 vs 同步

当处理大量I/O操作时，异步代码性能碾压同步阻塞模式：

import aiohttp
import time

# 异步请求（并发）
async def async_fetch(url):
    async with aiohttp.ClientSession() as session:
        async with session.get(url) as response:
            return await response.text()

async def main_async(urls):
    tasks = [async_fetch(url) for url in urls]
    return await asyncio.gather(*tasks)

# 同步请求（顺序阻塞）
def sync_fetch(url):
    import requests
    return requests.get(url).text

def main_sync(urls):
    return [sync_fetch(url) for url in urls]

# 测试100个请求
urls = ["https://example.com"] * 100

start = time.time()
asyncio.run(main_async(urls))
print(f"异步耗时: {time.time() - start:.2f}s")  # 约0.8秒

start = time.time()
main_sync(urls)
print(f"同步耗时: {time.time() - start:.2f}s")  # 约4.5秒

输出示例：
异步耗时: 0.82s
同步耗时: 4.53s
异步效率提升超过5倍！

关键技术剖析

事件循环底层：
使用系统级I/O多路复用（如selectors模块），监听文件描述符事件。
协程状态机：
每个协程维护执行状态（挂起/运行），await触发状态切换。
Future对象：
代表异步操作的最终结果，事件循环通过它管理协程依赖。
Task对象：
对协程的进一步封装，可查询状态、取消任务。

适用场景与最佳实践

最适合：高并发I/O操作（HTTP API、数据库读写、文件操作）
不适用：CPU密集型计算（需结合多进程）
关键原则：

- 避免在协程内使用阻塞调用（如time.sleep() → 改用asyncio.sleep()）
- 使用支持异步的库（如aiohttp替代requests，aiomysql替代pymysql）
- 合理控制并发量（信号量asyncio.Semaphore防止资源耗尽）

异步IO的本质是：用状态切换替代线程切换，用回调机制替代阻塞等待。掌握它，你将在Web服务、爬虫、实时系统中游刃有余，轻松应对C10K问题！

通过深入理解事件循环调度机制与协程协作原理，开发者可大幅提升程序吞吐量。本文示例已验证：异步IO在I/O密集型任务中性能优势显著，合理运用将成为高并发系统的核心利器。