Python爬虫基础之UrlError

本文介绍了Python中使用urllib库进行网络请求时可能出现的URLError和HTTPError异常,并通过示例代码展示了如何捕获和处理这些异常。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、urllib.error

python的urllib.error模块主要是应对urllib.request在网络请求过程中出现的异常而定义的异常处理类。主要有URLError和HTTPError两个类,URLError的父类是OSError,HTTPError是URLError的子类。

1.urllib.error.URLError

URLError是OSError的子类,当请求过程中没有网络连接,域名映射的服务器不存在都会抛出异常。

属性reason,说明产生异常的原因,返回一个字符串错误信息或者另外一个异常实例对象。

 1 import urllib.request
 2 import urllib.error
 3 
 4 try:
 5     request = urllib.request.Request('http://www.baidu.com/')
 6     response = urllib.request.urlopen(request)
 7     print(response.read().decode('utf-8'))
 8 except urllib.error.HTTPError as e:
 9     print('http error:%s' % e.reason)
10 except urllib.error.URLError as e:
11     print('url error:%s' % e.reason)

 产生异常:

 Request参数Url传入一个不存在的域名地址www123.baidu.com或者直接拔掉网线(禁用网络连接),程序就会抛出URLError

 request = urllib.request.Request('http://www123.baidu.com/')

 捕捉并打印异常信息:url error:[Errno 11004] getaddrinfo failed

 

2.urllib.error.HTTPError

HTTPError是URLError的子类,urllib.request.urlopen()请求过程中产生HTTP错误,例如资源不存在、身份授权异常,服务器内部错误等。

属性code,返回http请求的状态码,例如200、404、500等

属性reason,说明产生异常的原因,返回一个字符串错误信息。

属性headers,urllib.request请求触发HTTP Error异常,返回响应的请求头headers信息。

 1 import urllib.request
 2 import urllib.error
 3 
 4 try:
 5     request = urllib.request.Request('https://www.cnblogs.com/123.html')
 6     response = urllib.request.urlopen(request)
 7     print(response.read().decode('utf-8'))
 8 except urllib.error.HTTPError as e:
 9     print('http error: http code :{0},error msg :{1}'.format(e.code, e.reason))
10 except urllib.error.URLError as e:
11     print('url error:%s' % e.reason)

产生异常:
Request参数Url传入一个不存在的页面地址123.html,请求的资源不存在,程序就会抛出HTTPError异常

request = urllib.request.Request('https://www.cnblogs.com/123.html')

捕捉并打印异常信息:http error: http code :404,error msg :Not Found

转载于:https://www.cnblogs.com/taotaoblogs/p/7142666.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值