requests使用retry策略

最新推荐文章于 2024-08-25 20:45:35 发布

weixin_30278311

最新推荐文章于 2024-08-25 20:45:35 发布

阅读量2.2k

点赞数

CC 4.0 BY-SA版权

文章标签：爬虫

原文链接：http://www.cnblogs.com/thomaszdxsn/p/requests-shi-yongretry-ce-lue.html

本文介绍了如何在Python的requests和urllib3库中使用重试策略。通过实例展示了如何针对特定HTTP状态码进行重试，如500错误，以及如何配置重试次数和错误列表。文章还提到了requests的传输适配器概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在urllib3中使用retry
在requests中使用retry

网络请求往往会有很多不受控制的意外情况发生，有时候我们要让它let it crash，有时候我们想多尝试几次。

以前，使用retry策略，我一般会使用tenacity¹这个第三方库。这个库的API相当得漂亮，很多大V也推荐过。

最近，我看了一篇文章²，是requests的作者之一写的。他告诉我们，requests原生就支持retry。

在urllib3中使用retry

urllib3使用PoolManager，可以对特定的response设置retry。

比如，下面我们对500错误进行了retry：

from urllib3.util import Retry
from urllib3 import PoolManager

retries = Retry(total=5, status_forcelist=[500])
manager = PoolManager(retries=retries)
response = manager.request('GET', 'https://httpbin.org/status/500')

在requests中使用retry

from requests.packages.urllib3.util import Retry
from requests.adapters import HTTPAdapter
from requests import Session, exceptions

s = Session()
s.mount('https://', HTTPAdapter(
    max_retries=Retry(total=5, status_forcelist=[500])
    )
)

s.get('https://httpbin.org/status/500')

可以看到requests的API一贯的简洁。另外需要知道的是这里利用了requests的"传输适配器(Transport Adapter)"，如果你对这个不了解，请看这篇博客³.