爬虫-逆向加密算法使用手册

原创

已于 2025-06-12 20:54:07 修改 · 2k 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#爬虫

于 2025-06-12 20:53:25 首次发布

url编码

import urllib.parse

# URL编码
urllib.parse.quote(str)

# URL解码
urllib.parse.unquote(str)

# 将字典或元组序列转换为URL查询字符串
urllib.parse.urlencode(字典/元组)

# 将URL查询字符串解析为字典
urllib.parse.parse_qs(str)

base64编码

base64是什么

Base64编码，是由64个字符组成编码集：26个大写字母A-Z，26个小写字母a-z，10个数字0-9，符号“+”与符号“/”。Base64编码的基本思路是将原始数据的三个字节拆分转化为四个字节，然后根据Base64的对应表，得到对应的编码数据。

当原始数据凑不够三个字节时，编码结果中会使用额外的符号= 来表示这种情况。

base64原理

3个字符为一组的的base64编码方式
在这里插入图片描述

import base64
# 将字符串you转换成utf-8字节
bs = "you".encode("utf-8")

# 把字节转化成b64
base64.b64encode(bs).decode()

注意：b64处理后的字符串长度. 一定是4的倍数. 如果在网页上看到有些密文的b64长度不是4的倍数. 会报错

import base64
s = "eW91eQ"

s += ("=" * (4 - len(s) % 4))
print("填充后", s)
ret = base64.b64decode(s).decode()
print(ret)

base64变种

# 方式1
data = res.text.replace("-", "+").replace("_", "/")
base64.b64decode(data)
# 方式2
data = base64.b64decode(res.text, altchars=b"-_")  # base64解码成字节流