urllib库 request请求

最新推荐文章于 2024-07-16 23:20:29 发布

weixin_30435261

最新推荐文章于 2024-07-16 23:20:29 发布

阅读量88

点赞数

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/airapple/p/9131759.html

本文介绍了如何利用Python中的urllib.request模块来抓取网页内容，并解决了在打印网页源码时可能出现的编码问题。

import urllib.request

url = 'http://www.baidu.com/'
response = urllib.request.urlopen(url=url)

print(response.read().decode()) #默认utf8解码

#直接解码有可能会出现下图错误

当print(response.read().decode(‘gbk’)) 时，依然会报错

此时可以采用下面方法解决

import io
import sys
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8')　　 #改变标准输出的默认编码

这样就不会报错了

转载于:https://www.cnblogs.com/airapple/p/9131759.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。