URL 多次编码(\变%255C)(/变%255F)

文章讲述了在处理URL时遇到的多重转义问题,通过Python的urllib.parse模块的quote和unquote函数进行转义和解码,演示了如何正确还原URL的原始内容。通过两次转义和解析,成功将二次转义后的URL恢复到初始状态。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景

一些工具在通过浏览器打开URL对应页面时会经过多重的转义,以至于只经过一次URL的解析无法还原出URL的原样。在分析页面路径时很让人困惑。

示例

from urllib.parse import quote

url1 = "\百度"
print("url内容", url1)
ret1 = quote(url1, encoding="utf-8")
print("一次转义", ret1)
ret_q = quote(ret1, encoding="utf-8")
print("二次转义", ret_q)

运行结果

url内容 \百度
一次转义 %5C%E7%99%BE%E5%BA%A6
二次转义 %255C%25E7%2599%25BE%25E5%25BA%25A6

在转义过后 \转变为%255C

解决

多重转义大多情况下每一层转义都遵守相同的转义编码格式,直接通过解析得到原有的内容
完整代码

from urllib.parse import quote, unquote

url1 = "\百度"
print("url内容", url1)
ret1 = quote(url1, encoding="utf-8")
print("一次转义", ret1)
ret_q = quote(ret1, encoding="utf-8")
print("二次转义", ret_q)

ret2 = unquote(ret_q, encoding="utf-8")
print("一次解析", ret2)
ret3 = unquote(ret2, encoding="utf-8")
print("二次解析", ret3)

运行结果

url内容 \百度
一次转义 %5C%E7%99%BE%E5%BA%A6
二次转义 %255C%25E7%2599%25BE%25E5%25BA%25A6
一次解析 %5C%E7%99%BE%E5%BA%A6
二次解析 \百度
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

The_Singing_Towers

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值