Python爬虫：某网站cookie参数__jsl_clearance_s生成分析（一）

最新推荐文章于 2024-09-07 18:47:57 发布

YungGuo

最新推荐文章于 2024-09-07 18:47:57 发布

阅读量3.9k

点赞数 9

分类专栏： Python爬虫文章标签： python js web 爬虫 cookie

本文链接：https://blog.youkuaiyun.com/YungGuo/article/details/109818327

版权

逛论坛发现一个求助帖，想获取数据但网站有cookie反爬，闲来无事就分析了一下cookie参数生成方法~

2021-01-04更新：如果此篇看不懂，可直接看第二篇，只要是网站使用的是同一家公司的服务（加速乐），这个参数获取方式都是一样的。

目标：生成cookie中的__jsl_clearance_s参数

工具：chrome/firefox浏览器、fiddler、pychram、python3.7、解混淆专解测试版V0.1

模块：requests、re、execjs、json

分析：

首先打开浏览器，和fiddler抓包工具，发现浏览器进行了三次请求，前两次响应的状态码为521，响应内容都是一段js代码，第三次请求响应得到正常内容，并且携带了两个cookie参数；

在这里插入图片描述
通过三次请求对比，发现第三次请求cookie中的__jsl_clearance_s参数和第二次请求中的并不一样；
先看看第一次响应的结果，为一段js，这段js代码为浏览器设置了一个cookie；

这里直接利用正则将这段代码提取出来，再利用execjs模块执行，即可得到这个cookie：

# 提取js代码
js_clearance = re.findall('cookie=(.*?);location', response.text)[0]
# 执行后获得cookie参数js_clearance
result = execjs.

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

YungGuo

关注关注

9
点赞
踩
22

收藏

觉得还不错? 一键收藏
10
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

加速乐(__jsl_clearance_s)动态cookie生成分析实战

吴秋霖的博客

08-23

9967

手把手带你分析补环境还原加速乐（jsl）cookie动态生成

Python爬虫逆向案例:某创网cookie值分析-加速乐

2201_76125393的博客

02-22

740

第一次请求网站，网站返回的状态码为 521，响应返回混淆的 JS 代码；第二次请求网站，网站返回的状态码为 521，响应返回的为经过 OB 混淆的 JS 代码；第三次请求网站，网站返回的响应状态码 200，即可正常访问到网页内容。第一次请求网站，服务器返回的 Set-Cookie 中携带 jsluid_s 参数，将获取到的响应内容解密拿到第一次 jsl_clearance_s 参数的值；

10 条评论您还未登录，请先登录后发表或查看评论

JS逆向实战2--cookie——__jsl_clearance_s 生成

有什么问题回复不及时，可以私聊我。也可以加我的星球：知识爬行者

06-21

959

本文章中所有内容仅供学习交流，抓包内容、敏感网址、数据接口均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关，若有侵权，请联系我立即删除！

Python爬虫 __jsl_clearance解密

浪漫寄予思念

11-07

230

【代码】Python爬虫 __jsl_clearance解密。

gsxt cookie：__jsl_clearance_s 参数研究获取

qyf__123的博客

03-25

1711

gsxt cookie：__jsl_clearance_s 参数研究获取

__jsl_clearance_s 加速乐

wangenjie1992的博客

04-12

581

__jsl_clearance_s 加速乐

Python爬虫：某网站cookie参数__jsl_clearance_s生成分析（二）

YungGuo的博客

01-04

2453

之前写了一篇__jsl_clearance_s参数分析生成，现在更新一篇，使用python生成参数（上一篇是使用python+js），这次分析的网站是这个：https://www.cnvd.org.cn/flaw/list.htm。目标：生成cookie中的__jsl_clearance_s参数工具：chrome/firefox浏览器、fiddler、pychram、python3.7、解混淆专解测试版V0.1 模块：requests、re、execjs、hashilib、json、reque

小白也能懂：逆向分析某网站加速乐Cookie参数流程详解

互联网架构小马的博客

07-01

1915

加速乐采用了一系列的高级反爬虫技术，包括OB混淆、动态加密算法和多层Cookie获取，以确保整体校验的严密性。关键校验字段位于Cookie中的。其验证过程通常涉及三次关键的请求首次请求：当用户首次尝试访问目标网站时，服务器会返回一个特殊的521状态码，其响应数据通过AAEncode技术进行混淆处理，以初步筛选访问者。二次请求：紧接着的第二次请求中，如果服务器继续检测到可疑行为，它会再次返回521状态码，但这次响应数据将采用更为复杂的OB混淆，进一步验证访问者的身份。三次请求。

Python反反爬之JS混淆---动态Cookie(持续更新详细教程)

Java_S12138的博客

12-28

3399

写在前面第一题JS混淆—源码乱码经过上一题的练习JS混淆—源码乱码,我们已经对JS混淆有了大致的了解,这次我们再来练习一道同类型的题目,只不过这次是动态Cookie 首先,让我们了解一下什么是Cookie Cookie 并不是它的原意“甜饼”的意思, 而是一个保存在客户机中的简单的文本文件, 这个文件与特定的 Web 文档关联在一起, 保存了该客户机访问这个Web 文档时的信息, 当客户机再次访问这个 Web 文档时这些信息可供该文档使用。由于“Cookie”具有可以保存在客户机上的神奇特性, 因此它可

【Cookie加密】加速乐__jsl_clearance_s参数逆向

最新发布

liangzaixiaozhou的博客

09-07

650

需要逆向的参数：网址请求需要携带的cookie值【__jsl_clearance_s】__jsl_clearance_s来源：某安全盾一个cookie加密需要了解的知识点：什么是混淆，OB混淆的格式增加知识点的飞机票：大家自行搜索了解相关知识点，网上很多。

三次请求值逆向 __jsl_clearance_s 参数

迷心兔的博客

02-25

1442

学习文章： http://www.79tui.com/happy/739391.html https://www.cnblogs.com/re-is-good/p/mafengwo_version2_ast_cookie.html 1.请求步骤第一次请求18252205.html： 1.Response Headers： cookie中的__jsluid_s 2.响应内容【是cookie中的__jsl_clearance_s】：第二次请求18252205.html【携带第一次请求.

一.爬虫--破解网站通过js加密生成cookie（一）

weixin_35762183的博客

03-15

8354

做爬虫这么久了,遇见过千奇百怪的网站．本次记录一次简单破解js加密的网站．目标网站：中国土地市场网采集信息：如图需要采集的内容就是行政区代码，标题，标题的url，和发布时间．好了，感觉应该不难．那我们先尝试一下吧： # -*- coding: utf-8 -*- import requests url = &amp;amp;quot;http://www.landchina.com/default.aspx?t...

从头学习爬虫（四十）高阶篇----模拟js生成Cookie中__jsl_clearance来破解加速乐的反爬虫机制

qq_36783371的博客

09-20

8248

本文主要提供中间模拟生成Cookie中__jsl_clearance字段来破解加速乐的反爬虫机制前后通过postman模拟代替代码实现一需求 http://www.cyicai.com/information/applyForSubscription 需要爬取二分析请求分析了一下第一个521 请求cookie 没有__jsl_clearance 第二个请求里就有...

爬虫漫游指南：加速乐__jsl_clearance破解

shayuchaor的博客

09-30

8049

本文会介绍加速乐cookie中的__jsl_clearance的生成方式。纯粹技术讨论，如果侵害到任何人的利益，请联系本人邮箱yu_haojia@foxmail.com，会立刻删除。

python 爬虫破解__jsluid_s 和 __jsl_clearance_s加密参数

asjdjcndsmc的博客

04-04

568

破解__jsluid_s 和 __jsl_clearance_s加密参数。

爬虫篇（2）使用pyexecjs破解js中cookies

tzyyy1的博客

06-20

3224

首先下载pyexecjs： pip install PyExecJS 如果有需要，自行下载PyV8 , Node.js , PhantomJS等使用参考：https://github.com/doloopwhile/PyExecJS PyExecJS文档：https://pypi.org/project/PyExecJS/ 此次采集链接：http://www.landchi...

【Js逆向】__jsl_clearance 无混淆加速乐

苟日新，日日新，又日新!!!

01-29

1184

__jsl_clearance 加速乐~

Python中Cookie的处理（一）Cookie库

xiaoyaozi2020的博客

09-15

707

domain：有些网站有许多小的域名，例如百度可能还在"news.baidu.com" “zhidao.baidu.com” 和"v.baidu.com" 域名下有网页．如果想让"baidu.com"下的所有机器都可以读取该cookie，必须在cookie中加入 “domain=.baidu.com” ．。路径"path"用于设置可以读取一个cookie的最顶层的目录．将cookie的路径设置为你的网页最顶层的目录可以让该该目录下的所有网页都能访问该cookie．。

【Python】爬虫+动态Cookie获取