python3 下 url解码

博客介绍了在URL中出现中文字符时的编码情况。一般中文字符编码为utf - 8格式的百分号编码,部分网站采用gbk编码。其中,utf - 8格式下1个中文字符编码为3个字节的百分号编码,python3 urllib.parse默认编码是utf - 8;gbk格式下1个中文字符编码为2个字节的百分号编码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在url中出现中文字符时候,一般都是编码为utf-8格式的百分号编码的,但是也有部分网站encode成gbk编码格式。

  1. utf-8格式: 1个中文字符编码为3个字节的百分号编码格式;(python3 urllib.parse 默认编码是utf-8)
  2. gbk格式: 1个中文字符编码为2个字节的百分号编码格式。
from urllib.parse import unquote,quote

name = '国'
gbk_name = quote(name,encoding = 'gbk')
print(gbk_name)
print(unquote(gbk_name, encoding='gbk'))

utf_name = quote(name)
print(utf_name)
print(unquote(utf_name))
E:/track_code/test.py
>>>%B9%FA
>>>国
>>>%E5%9B%BD
>>>国
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值