
凤凰网
全球互联网遭“断联”惊魂。
亿欧11月18日消息,全球顶尖网络安全服务商CDN霸主Cloudflare突发大规模全球性网络故障,导致OpenAI(ChatGPT)、X(原Twitter)、Spotify、Uber等数十家国际顶级平台陷入服务瘫痪,数千万用户遭遇 “访问失败” 惊魂时刻。甚至连美国公共交通也受到此次事件波及。
截至美东时间早上6:41,故障监测平台Downdetector已收到X平台超过上万份问题报告,而 ChatGPT 在北京时间晚间九点仍有大量用户无法正常登录使用。
Cloudflare自身的故障状态页面一度完全无法打开,其客户支持门户也同步陷入瘫痪,导致用户与企业均无法获取官方实时通报。
多位海外朋友向亿欧表示,今天的宕机事件,“感受很明显”!
全球互联网遭 “断联” 惊魂
Cloudflare官方发言人表示,公司在周二一大早就观察到一项服务“异常流量激增”。主要问题表现为 "widespread 500 errors" 和"internal server error",这两大问题均直指服务器端错误,前者是大范围出现的500错误,后者是500错误的标准定义(即 “内部服务器错误”)。

援引CNBC消息,在Cloudflare网络修复过程中,Cloudflare表示它在英国伦敦禁用了WARP访问。对于那些试图通过WRP访问互联网的人来说,他们将无法连接。
作为全球网络的 “隐形守护者”,
Cloudflare却频繁“翻车”
总部位于美国旧金山的 Cloudflare,是全球领先的 CDN(内容分发网络)与网络安全服务提供商,业务覆盖全球数十万家企业,扮演着网站与终端用户之间的 “安全缓冲器” 角色,核心功能是抵御 DDoS 攻击、保障网络访问速度与稳定性。
Cloudflare客户群体包括 10% 的财富 1000 强企业,服务覆盖全球 10 亿级 IP 地址,承载着全球互联网近 10% 的骨干网流量,堪称互联网基础设施的 “命脉级” 企业。近年来该公司积极布局 AI 领域,推出 NLWeb 协议与 AutoRAG 检索引擎,深度绑定 OpenAI 等 AI 巨头的服务分发网络。

作为全球网络的 “隐形守护者”,Cloudflare近年来却频繁“翻车”。
2019年7月,Cloudflare软件的一个漏洞导致其部分网络耗尽全公司计算资源,致使全球数千家依赖其服务的网站最长宕机30分钟。
2022年6月,Cloudflare再次发生故障,波及19个数据中心故障,导致多家主流网站和服务陷入瘫痪,此次事故造成 1.5 小时服务中断。
2025年3月,Cloudflare因密码轮换错误其R2对象存储及相关服务发生了一次持续1小时7分钟的中断事件,事情导致全球范围内出现100%的写入失败和35%的读取失败。
此次故障再次暴露其在高风险操作流程上的管控漏洞,未严格执行双重验证与分阶段部署机制。
截至发文,Cloudflare因此次宕机事件致股价大跌4.27%,市值蒸发30.24亿美金。
美国网络安全问题频发
无独有偶,10月20日,亚马逊云DNS发生故障,导致全球服务瘫痪。
据悉,亚马逊 AWS 云服务发生的重大故障,引发了全球混乱,导致全球多家公司的网络连接出现问题,多个热门网站和应用服务中断。
AWS在其状态页面更新中确认,美国东部的多项AWS服务中出现错误率上升和延迟增加的情况。网络故障追踪平台“网络探测器”显示,亚马逊的购物网站、视频服务以及语音助手同期均出现问题。
每日经济新闻
突发,美国多个网站崩了!
11月18日,知名网络基础设施公司Cloudflare表示,其全球网络出现问题,导致许多网站和应用程序的服务中断,包括X(原twitter)和ChatGPT在内的多家互联网平台无法访问。据媒体报道,Spotify和亚马逊也出现了服务中断。
Cloudflare股价盘前一度下跌超5%。

值得注意的是,18日晚,话题“cloudflare崩了”“推特崩了”登上微博热搜榜。
官网显示,Cloudflare是一个全球性的云平台,为世界各地的各种规模的企业提供广泛的网络服务,同时提高其关键互联网资产的性能和可靠性。Cloudflare还为全球125个国家/地区的330个城市提供数据传送服务。
新智元
AI杀死了AI!Cloudflare全球崩盘惨案,元凶已被原地解雇
【导读】一次「常规更新」搞崩半个地球,Cloudflare CTO紧急谢罪:我们搞砸了!Cloudflare自杀式Bug引发连锁反应,波及全球20%网站。当数百万爬虫撑爆了防御名单,Cloudflare的崩溃揭示了AI时代最深的基建隐忧,人类还能跟得上AI进化的脚本吗?
果然这个世界建立在脆弱性之上。
昨天,2025年11月18日,全球AI数字生态系统经历了一次近乎心跳骤停般的休克。
Cloudflare崩溃了!
然后全球五分之一的互联网服务几乎全部宕机,尤其是,AI巨头集体断网!ChatGPT、X全线崩盘!
当你还在拿着这个图调侃的时候。。。

殊不知,真正的情况是,Cloudflare现在互联网真正的底座。

马斯克在之前亚马逊宕机时还调侃,这次终于是风水轮流转!

只不过,老马没想到的是,这次CF的影响直接让自己家服务也宕机了~


Cloudflare的CTO赶紧发了个申明:是我们的错误,立正挨打。
下面会详细介绍这次引发故障的原因,简直就是草台班子级别,只能说人类社会用规则来和计算机打交道还是太脆弱了!

先说说这次事故的影响。
这起事故影响范围之广前所未见,被称为「半个互联网的停摆」毫不夸张——约20%的网站依赖Cloudflare提供服务。
Cloudflare还有个称号叫做赛博活佛,特别是在极客群体中,很多服务,如果个人用都是免费的。
这里作为对比,必须夸一下咱们国内的基建服务了,不管是微信、B站、视频网站,你很少碰到如此级别大规模的故障。(ToB的服务不细讲,这个离普通消费者也很远)
故障高峰时,网站故障追踪平台Downdetector收到了累计逾210万条报错反馈,成为近年来最严重的基础设施级中断之一。
包括亚马逊、Spotify、Zoom、Uber等知名服务也受到波及(部分功能异常或加载缓慢)。
Cloudflare作为支撑全球海量流量的「隐形基建」,一次失误便牵一发而动全身,令股价盘中一度重挫约7%。
更令人深思的是,一些本用于监测网络故障的工具(如Downdetector)因本身也使用Cloudflare,甚至在事故中一同瘫痪—整个互联网生态对单一底层的依赖程度,由此可见一斑。
更「细思极恐」的是,当Cloudflare的工程师想要打开ChatGPT来修复故障时,AI也宕机了~

很多网友都形容那宕机的三个小时,如此「黑暗」,就像回到了远古时期。

Cloudflare这次导致全球断网的技术故障,其实是一次典型的「好心办坏事」。

网友们制作的恶搞图
简单来说,就是工程师试图升级安保系统的权限,却意外让负责安检的软件「吓晕」了。
(如果是AI来操作,以硅基同步的能力和运算的能力,大概率不会出这种岔子,这也就是碳基人类写下的固定规则才能导致了,还是人类规则太脆弱了。这里让我联想到马斯克为啥一直坚持FSD使用纯视觉,就是人类你不可能遍历所有驾驶过程,就像这次CF的故障,没有工程师能预先为这种场景写下规则)
根据Cloudflare官方博客的复盘,事情是这样发生的:

起因是系统「大扫除」。
工程师原本在进行一项常规的维护工作,目的是为了提高安全性。他们调整了数据库的权限,想把原本公用的「系统账号」改成责任更明确的「个人账号」。
然后这个看似无足轻重的操作,触动了隐藏在系统中「旧伤」。
系统里潜伏着一段很老的代码,它负责生成一份用来识别网络机器人的「特征名单」(Feature File)。
这段代码以前只在一个默认的数据库里找名单,所以没问题。
但这次权限升级后,它突然能看到另一个备份数据库了。
由于代码里没写清楚「只看哪一个」,它傻乎乎地把两边的名单都抓取了过来,名单被「膨胀」了。
这导致那份原本精简的「特征名单」瞬间膨胀,内容重复了一倍。
结果就是,保安「罢工」。
Cloudflare负责在全球各地转发流量的核心软件有一个硬性规定:为了保证速度,名单长度不能超过200条。
当这份意外「发福」的名单被推送到全球服务器时,软件发现名单太长读不完,直接触发了内存溢出保护机制(Panic),也就是彻底崩溃。
为了安全起见,它切断了所有连接。
简单说就是,本来机器数据库权限不够,调整后,它突然权限高了点,然后也没有为这个情况提前写下判断代码。
打个再通俗的比方(可能不是那么准确)。
这就好比大楼物业给保安发了一副新眼镜(升级权限),本意是让他看得更清楚。
结果因为新眼镜度数没调好,保安看手里的「访客黑名单」时出现了重影,原本100人的名单在他眼里变成了200人。
保安的脑容量(系统限制)记不住这么多人,瞬间由于信息过载而「死机」晕倒,导致大楼门禁系统自动锁死,把所有访客(包括X和ChatGPT的用户)都关在了门外。
不过目前问题已经修复了(其实不是啥大问题,就是逻辑改改就行)。

如果不只是把这次事故看作一个单纯的技术故障,而是放在2025年「AI疯狂吞噬数据」的背景下去看,你会发现这充满了黑色的讽刺意味。

AI杀死AI
导致这次崩溃的核心组件是「机器人管理系统(Bot Management)」。
在2025年,这个系统的主要假想敌是谁?正是AI爬虫。
随着大模型训练对数据的极度渴求,互联网上充斥着无数自动化的AI抓取程序。
Cloudflare作为「守门人」,必须不断升级其算法来区分「真人」和「AI机器人」。
特征文件(Feature File),对就是报告中提到的那个导致崩溃的「特征文件」,实际上就是机器学习模型用来判断流量性质的「参数集」。
每一个「特征(Feature)」都是一个判断维度(比如鼠标移动轨迹、点击频率、IP行为模式等)。
为了应对越来越狡猾的AI机器人,Cloudflare的防御系统变得越来越复杂,需要调用的「特征」越来越多。
这次故障的直接原因就是数据库错误地吐出了过多的特征数据,导致防御系统的「大脑」过载。
这不是一次普通的软件崩溃,这是「数字免疫系统」在试图升级以对抗AI病毒时,因自身的排异反应而休克。
这次事件最荒诞的地方在于受害者名单。
OpenAI、xAI、Perplexity:这些是全球最大的AI公司,它们同时扮演了两个角色:
它们的爬虫在全网搜刮数据,迫使Cloudflare建立更复杂的防御系统(即这次崩溃的源头)。
它们自己也极其依赖Cloudflare来防止被别人攻击或滥用。
结果呢?
Cloudflare为了防御AI抓取行为而维护的系统,因为一次配置错误,反过来「杀死了」最顶级的AI服务商。
这就像是为了防止野兽入侵而把城墙修得太高太重,结果城墙倒塌,把住在城里的国王(AI巨头)给压垮了。
这揭示了AI时代基础设施的内卷化困境——为了对抗技术的滥用,我们不得不把基础设施造得越来越复杂、越来越脆弱。
你问这和AI有什么关系,或许这就是AI时代的「技术债」。
这里有一个更深层的隐喻:「特征膨胀」。
在传统的软件工程中,逻辑通常是线性的。
但在涉及AI和机器学习的防御体系中,系统依赖于成百上千个「特征」来进行概率判断。
这次故障是因为特征数量突破了200个的硬编码限制而引发的。
这暴露了一个问题:我们正在构建一种人类难以完全掌控的「黑箱基建」。
为了拦截智能程度极高的AI机器人,防御规则不能再是简单的黑白名单,而必须是动态的、基于行为分析的复杂模型。
这种复杂度的指数级上升,意味着未来类似的「不可预测的崩溃」会越来越多。
我们正在用复杂的AI(防御)去对抗复杂的AI(进攻),而夹在中间的,是脆弱的物理互联网。
这次宕机不仅是一个配置错误,它是人类互联网为了适应AI寄生而进行的一次痛苦痉挛。
它是「矛」(AI抓取)与「盾」(AI防御)在无限升级的军备竞赛中,把战场(互联网基础设施)给撑爆了。

但是,这波也有用AI来打败AI的正面例子。
比如,吴恩达团队就在Cloudflare宕机的过程中,用AI快速实现了Cloudflare功能的克隆版本,成为最早一批恢复运行的网站。
属实是用魔法打败魔法了!

最后再放一个彩蛋。

彩蛋:元凶被原地解雇
X上这位名为Rob Hallam的哥们发了个帖子。
说他正是那位搞崩全球互联网的工程师(可能是之一)。
自称是,能用单个正则表达式让20%互联网瘫痪,哈哈哈🤣


原文:
史诗级宕机!CDN霸主Cloudflare全球网络崩了:OpenAI、X、Uber等平台服务瘫痪,集体失联_凤凰网
突发,美国多个网站崩了! | 每经网
AI杀死了AI!Cloudflare全球崩盘惨案,元凶已被原地解雇
Cloudflare全球宕机致AI服务瘫痪
562

被折叠的 条评论
为什么被折叠?



