Python实现JS逆向解密采集网站数据

本文介绍了使用Python进行JS逆向工程,解析加密参数以爬取网站数据的过程。主要内容包括环境配置、所需模块、如何查找加密参数生成规则、解密响应数据及解决Python模块安装和PyCharm配置问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取


环境使用:

  • Python 3.8

  • Pycharm

  • nodejs


模块使用:

  • import requests --> pip install requests

  • import execjs --> pip install pyexecjs

  • import json


实现爬虫程序:

  1. 抓包分析数据在什么地方

    • 开发者工具抓包 --> F12

      当被禁止调用开发者工具的时候

  2. 选择其他年份的数据 --> XHR

    数据包接口: https://www.aqistudy.cn/historydata/api/historyapi.php

    • 加密参数:

      请求参数加密: hA4Nse2cT <√>

      响应数据加密:

  3. 分析加密数据生成规则 --> JS代码生成

    传入某些值<明文> 通过JS代码函数<加密方式>生成密文数据

    如何查找加密参数生成位置:

    1. 直接搜索关键字 hA4Nse2cT

    2. 通过启动器里面堆栈 send 打上断点

    先用python代码去请求链接获取响应加密数据

    大胆猜想, 小心实践

    hex_md5 --> MD5加密


代码展示

“”“导入模块”“”

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:926207505
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
# 导入编译JS代码模块
import execjs
# 导入数据请求模块
import requests
# 导入json模块
import json
# 导入csv模块
import csv
import pandas as pd

“”“发送请求”“”

month_list = ['202301', '202302', '202303', '202304','202305','202306'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值