利用Python对网站是否使用CDN进行“粗暴”的判断

本文深入解析CDN(Content Delivery Network)的工作原理,及其在提升网站访问速度与安全性方面的作用。通过实例演示,作者分享了一种利用Python脚本判断目标网站是否使用CDN的创新方法,通过检查域名解析返回的IP数量,实现对CDN部署的初步判断。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

什么是CDN?

CDN全称Content Delivery Network即内容分发网络。
其简单说来就是为服务器建立一个缓存机制,它分布在各地不同的服务器中,当我们去访问使用了CDN的服务器域名的时候,它会根据我们的IP地址,选择离我们最近的CDN服务器,为我们提供更为快速的访问体验。
同时他也能隐藏服务器的真实IP,提升攻击门槛。

如何判断CDN?

网上其实也有很多关于如何判断对方网站是否使用了CDN的方法,比如nslookup,或者dig,或者ping,再或者收集一份CDN字典(注:很多CDN再HTTP的返回头中都有标识,只要你够肝,你就可以收集整理很大一部分的CDN标识字典)。
当然我觉得判断CDN最有效的方式其实还是使用全球PING,根据响应IP来进行判断。但是我没有这么多服务器,同时也不想去抓网站API接口来进行判断 :)

那么我是如何对CDN进行粗暴的判断的呢?

一个例子
我们会经常使用socket.getaddrinfo[host,port]这种方式去获取网站的IP

import socket
addr = socket.getaddrinfo('www.baidu.com','http')[0][4][0]
print(addr)

我只是个栗子
另一个例子
那么问题来了,如果我不指定port,我将其设置为None,这个时候,神奇的就来了,如果目标站点使用了CDN的话,那么getaddrinfo就会返回多个IP。

import socket

ip_list = []
addrs = socket.getaddrinfo('www.baidu.com', None)
for item in addrs:
    if item[4][0] not in ip_list:
        ip_list.append(item[4][0])
print(ip_list)

另一个栗子
最后
所以我的“粗暴”判断方式就是利用返回的IP数量来进行判断。(注:误报肯定是有的)

import socket
from threading import Thread, Semaphore

sm = Semaphore(20)
timeout = 5.0
# 超时判断
socket.setdefaulttimeout(timeout)


class ThreadWithReturnValue(Thread):
    def __init__(self, group=None, target=None, name=None, args=(), kwargs=None, *, daemon=None):
        Thread.__init__(self, group, target, name, args, kwargs, daemon=daemon)
        self._return = None

    def run(self):
        if self._target is not None:
                self._return = self._target(*self._args,**self._kwargs)

    def join(self):
        Thread.join(self)
        return self._return


def get_ip_list(domain):  # 获取域名解析出的IP列表
    dict = {}
    with sm:
        try:
            addrs = socket.getaddrinfo(domain, None)
            for item in addrs:
                if item[4][0] in dict:
                    dict.get(domain).append(str(item[4][0]))
                else:
                    dict.setdefault(domain, []).append(str(item[4][0]))
            # print('[*] Url: {} IP: {}'.format(domain, dict[domain][0]))
        except Exception as e:
            print('[-] Error: {} info: {}'.format(domain, e))
            pass
        except socket.timeout as e:
            print('[-] {} time out'.format(domain))
            pass
    return dict


def open_url_txt(filename):
    url_list = []
    with open(filename, 'r') as f:
        for l in f:
            url_list.append(l.strip())
    return url_list


def save_info(url, ip, key):
    if key == 1:
        with open('url_ip.csv', 'a+') as f:
            url_info = url + ',' + ip + '\n'
            f.write(url_info)

    else:
        with open('error_info.txt', 'a+') as f:
            f.write(url + ' ' + ','.join(ip) + '\n')



if __name__ == '__main__':
    url_list = open_url_txt('url_list.txt')
    thread_list = []
    for url in url_list:
        t = ThreadWithReturnValue(target=get_ip_list, args=(url,))
        thread_list.append(t)
        t.start()
    for t in thread_list:
        ip = t.join()
        if ip:
            for key in ip:
                if len(ip[key]) > 1:
                    print('[-] The Url: {} Maybe Exist CDN'.format(key))
                    save_info(key, ip[key], 0)
                else:
                    print('[*] Url:{} IP:{}'.format(key, ip[key][0]))
                    save_info(key, ip[key][0], 1)
    print('[*] End Scanner')

运行中

完成扫描的结果

疑似CDN的保存结果

最后的最后
我为什么要写这样一个脚本?其实不论是护网还是挖掘SRC,我们都会面临大量的域名,其中很大一部分都是部署了CDN的,如果我们盲目的使用端口扫描等工具的时候,会浪费我们大量的时间。并且我最近在写一个自己的信息收集框架,所以也算是为自己后面的框架写测试demo吧!😃
gayhub传送点:
https://github.com/HoldOnToYourHeart/qf_scan/blob/master/cdn_judge.py

以下为测试内容

1.1

<iframe οnlοad="alert(1)"></iframe>

1.2

<iframe src="javascript:alert(1)"></iframe>

1.3

<iframe src="vbscript:msgbox(1)"></iframe>

1.4

<iframe src="data:text/html,<script>alert(1)</script>"></iframe> Chrome

1.5

<iframe src="data:text/html,&lt;script&gt;alert(1)&lt;/script&gt;"></iframe>

1.6

<iframe srcdoc="&lt;script&gt;alert(1)&lt;/script&gt;"></iframe>

### 导致 'connection reset by peer' 错误的原因 #### 进程异常终止 当对端进程崩溃时,可能会触发 `connection reset by peer` 错误。这种情况通常发生在应用程序意外退出或因未处理的异常而停止运行的情况下[^2]。 #### 主动断开连接设置 如果服务器配置了特定参数使得其能够立即中断不再需要的连接,则也可能引发此错误消息。例如,在某些情况下,调用 `SetLinger(0)` 函数会使套接字在关闭时不等待待发数据完成传输而是立刻重置连接。 #### 负载均衡器的影响 TCP Keepalive 探测机制用于检测长时间闲置但仍保持打开状态的连接是否依然存活。然而,在经过一段时间(默认为两小时)之后发出探测请求前,若目标连接已被IPVS(Linux内核中的一个实现虚拟服务器的技术)删除或标记为不活跃,则会收到对方返回的RST包从而报告“Connection reset by peer”。这是因为尽管客户端和服务端都认为连接存在并有效,但实际上它已经在更高层次上被切断了[^5]。 #### 客户端与服务端同步问题 有时即使看起来简单的场景也会带来复杂的结果;比如本地机器尝试访问远程虚拟环境期间偶尔遭遇此类故障可能是由于两者间缺乏良好协调所致。这表明即便是在相对封闭可控的小型测试环境中也难以完全排除潜在风险因素的存在[^3]。 #### 服务不可达 另外一种常见情况就是简单粗暴的服务端失效情形——即所谓的“服务端挂掉”,这也同样可以解释为什么会出现这个提示信息。对于CDN运营商而言,这类看似初级却又容易被人忽视的问题反而更值得警惕[^4]。 ```python import socket def check_connection(host, port): try: with socket.create_connection((host, port), timeout=5) as sock: print(f"Successfully connected to {host}:{port}") except Exception as e: print(f"Failed to connect: {e}") check_connection('example.com', 80) ``` 上述代码展示了如何通过Python脚本来验证给定主机和端口之间的基本可达性。虽然这不是直接针对解决`connection reset by peer`的方法,但在排查过程中确认能否成功建立初步联系是非常重要的一步。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值