过cloudflare，使用cfscrape，以及cfscrape挂代理的方式

最新推荐文章于 2025-03-14 17:32:29 发布

Voccoo

最新推荐文章于 2025-03-14 17:32:29 发布

阅读量4.7k

点赞数 1

文章标签： cloudflare 过盾 cfscrape挂代理 python 海外代理

本文链接：https://blog.youkuaiyun.com/qq_38044574/article/details/115958551

版权

该博客介绍了如何使用Python模块`cfscrape`来绕过Cloudflare的反爬机制，支持Python2.6到3.7版本。示例代码展示了基本的访问方式以及结合代理进行访问的方法。通过获取并设置代理IP，然后利用`cfscrape`创建带延迟的 scraper 对象进行请求。在成功访问后，从响应中提取特定信息。博客还提供了访问失败的判断及相应处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一个简单的python模块，可以绕过cloudflare的反bot页面（也称为"我处于攻击模式"或iuam），它通过请求实现。支持Python2.6-3.7版本。

PS:下面所有运行环境都是在外网的服务器上

只需运行
pip install cfscrape。
您可以使用
pip install-u cfscrap进行升级。
pypi包位于 https://pypi.python.org/pypi/cfscrape/
github https://github.com/Anorov/cloudflare-scrape

#基础访问类型
import cfscrape
from parsel import Selector
import requests
session = cfscrape.create_scraper(delay=10)
response = session.get(url)

下面是挂代理的方式，代理需要在可访问外网的服务器上才可以进行，并且需要将服务器加入白名单。

注册个人或者公司认证后有测试量，可以进行免费测试
注册地址，打开注册

import cfscrape
from parsel import Selector
import requests

response = requests.get("http://tiqu.linksocket.com:81/abroad?num=1&type=2&lb=1&sb=0&flow=1&regions=&port=1&n=0")
ip = response.json()["data"][0]["ip"]
port = response.json()["data"][0]["port"]

ip = "{}:{}".format(ip, port)
proxies = {
    "http": "http://{}".format(ip),
    "https": "https://{}".format(ip),
}

ttt = requests.get("http://myip.top", proxies=proxies)
print(ttt.text)

ssss = cfscrape.create_scraper(delay=10)
cookies,user_agent= ssss.get_cookie_string("https://apkpure.com/", proxies=proxies, allow_redirects=True)

response = ssss.get("https://apkpure.com/cn/search?q=com.facebook.katana",proxies=proxies)
# # print(web_data)
if "开发者" in response.text:
    print("访问成功")
    down_html = Selector(text=response.text)
    info_url_list = down_html.css("div#search-res dd")
    for down_html in info_url_list:
        apk_name = down_html.css("p.search-title>a::text").extract_first()
        print(apk_name)
        print("=============")
else:
    print(response.text)
    print("访问失败")

如果能对你有帮助，是我的荣幸。谢谢。