Cloudflare WAF反爬处理

本文介绍了如何通过cloudscraper库解决网站的Cloudflare验证问题,涉及HTML解析和JavaScript动态校验,展示了如何使用python脚本来绕过验证获取网页内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

案例地址:https://www.semi.org/en/news-media-press/semi-press-releases

看似普通的get请求,但在本地拿requests请求会返回需要验证
在这里插入图片描述

通过观察可以发现,这是 Cloudflare的反爬措施。

一般情况,只要过了中间的校验,就能正常访问了。


在验证的位置有一个form表单。此时可以判断,如果ID等于challenge-form的元素,那么则需要校验。
在这里插入图片描述
但是html中并没有找到submit的位置。倒是有几个隐藏的input框。


猜测检验过程就在JS文件中, 不过并没有具体看。

网上已经有人开源了解决方法, pip install cloudscraper

示例代码:

import cloudscraper
url = ''
scraper = cloudscraper.create_scraper()
html = scraper.get(url).text
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

考古学家lx(李玺)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值