python2 爬取网页时 遇到需要对地址编码的

本文介绍在使用Python进行网页爬取时遇到的URL编码问题,详细解释了如何处理包含空格的URL,通过使用urllib.quote()函数进行正确的编码,确保网页能够被正确访问。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

http%3A//www.myctvs.com/blog 1.html 类似与这种中间空了一个空格,在html中显示是没有问题的,但是实际的地址 是:
http%3A//www.myctvs.com/blog%201.html -->>这样的是有问题的
可以访问的地址是-->>
"
https//www.myctvs.com/blog%201.html
"
直接访问 带空格的会出错,找不到这个网页,需要进行url编码
import urllib
URL = urllib.quote(“需要编码的地址”)
print(URL)
>>>http%3A//www.myctvs.com/blog%201.html
posted on 2019-05-27 16:36  吃瓜的瓜农 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/guanong/p/10931479.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值