python 修改TLS指纹

该文章介绍了一种通过修改Python SSL模块中的加密套件顺序来改变TLS指纹的方法,以此规避反爬虫策略。在使用代理时,需要注意启用修改TLS设置的正确方式,并提到了可能出现的错误及其原因。示例代码展示了如何创建一个自定义的HTTPAdapter来实现这一功能,并在实际请求中应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

代码来源青南大佬的文章:一日一技: Python 如何突破反爬虫指纹 JA3 - 墨天轮

原理是对python源码中ssl部分进行修改,对ORIGIN_CIPHERS中的加密方法进行打乱重组来修改TLS指纹

使用代理时需要注意的部分, 启用修改TLS设置s.mount("http://", DESAdapter()),第一个参数不能设置为 "https://", 否则会出现 AttributeError: 'NoneType' object has no attribute 'connection_from_url'  错误。

也有可能是我的代理不支持https的原因。

import random
import requests
from requests.adapters import HTTPAdapter
from requests.packages.urllib3.util.ssl_ import create_urllib3_context

ORIGIN_CIPHERS = (
    'ECDH+AESGCM:DH+AESGCM:ECDH+AES256:DH+AES256:ECDH+AES128:DH+AES:ECDH+HIGH:DH+HIGH:ECDH+3DES:DH+3DES:RSA+AESGCM:RSA+AES:RSA+HIGH:RSA+3DES')


class DESAdapter(HTTPAdapter):
    def __init__(self, *args, **kwargs):
        CIPHERS = ORIGIN_CIPHERS.split(":")
        random.shuffle(CIPHERS)
        CIPHERS = ":".join(CIPHERS)
        self.COPHERS = CIPHERS + ":!aNULL:!eNULL:!MD5"
        super(DESAdapter, self).__init__(*args, **kwargs)

    def init_poolmanager(self, *args, **kwargs):
        context = create_urllib3_context(ciphers=self.COPHERS)
        kwargs["ssl_context"] = context
        return super(DESAdapter, self).init_poolmanager(*args, **kwargs)

    def proxy_manager_for(self, *args, **kwargs):
        context = create_urllib3_context(ciphers=self.COPHERS)
        kwargs["ssl_context"] = context


if __name__ == '__main__':
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:101.0) Gecko/20100101 Firefox/101.0'
    }
    s = requests.Session()
    s.headers.update(headers)

    proxies = {
        'http': 'xxx.xxx.xxx.xxx:9000',
        'https': 'xxx.xxx.xxx.xxx:9000'
    }
    s.mount("http://", DESAdapter())

    response = s.get('https://ja3er.com/json', proxies=proxies)
    print(response.json())

### Python 绕过 TLS 指纹检测的技术方案 为了有效绕过TLS指纹检测,在Python中可以采用多种策略来模拟合法浏览器的行为,从而避免被服务器识别为自动化工具。具体措施包括但不限于: #### 修改User-Agent字符串 大多数Web应用程序会记录HTTP请求头中的`User-Agent`字段以判断来访者所使用的设备类型和操作系统版本。因此,设置一个常见的桌面版或移动版浏览器的User-Agent可以帮助隐藏爬虫身份。 ```python import requests headers = { 'User-Agent': ('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 ' '(KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36') } response = requests.get('https://example.com', headers=headers) print(response.status_code) ``` #### 使用自定义证书验证逻辑 当建立安全连接时,默认情况下某些库可能会暴露特定模式给远程主机用于匹配已知的安全配置文件。通过指定自己的CA捆绑包并禁用默认行为可减少这种风险。 ```python from urllib.request import Request, urlopen import ssl context = ssl.create_default_context() context.check_hostname = False context.verify_mode = ssl.CERT_NONE req = Request('https://tls.browserleaks.com/json') with urlopen(req, context=context) as response: data = response.read().decode('utf-8') print(data) ``` #### 调整TCP/IP栈参数 更高级别的规避手段涉及修改底层网络堆栈特性,比如窗口大小、MSS选项以及其他TCP选项字段。这通常需要借助第三方模块完成,并且可能违反目标网站的服务条款。 #### 应用层混淆技术 除了上述方法外,还可以考虑引入额外的应用程序级加密或者其他形式的数据编码方式,使得传输过程更加难以分析。不过这种方法同样存在法律合规性的考量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值