史诗级宕机!CDN霸主Cloudflare全球网络崩了:OpenAI、X、Uber等平台服务瘫痪,集体失联——崩溃元凶已找到!

Cloudflare全球宕机致AI服务瘫痪

凤凰网

全球互联网遭“断联”惊魂。

亿欧11月18日消息,全球顶尖网络安全服务商CDN霸主Cloudflare突发大规模全球性网络故障,导致OpenAI(ChatGPT)、X(原Twitter)、Spotify、Uber等数十家国际顶级平台陷入服务瘫痪,数千万用户遭遇 “访问失败” 惊魂时刻。甚至连美国公共交通也受到此次事件波及。

截至美东时间早上6:41,故障监测平台Downdetector已收到X平台超过上万份问题报告,而 ChatGPT 在北京时间晚间九点仍有大量用户无法正常登录使用。

Cloudflare自身的故障状态页面一度完全无法打开,其客户支持门户也同步陷入瘫痪,导致用户与企业均无法获取官方实时通报。

多位海外朋友向亿欧表示,今天的宕机事件,“感受很明显”!

全球互联网遭 “断联” 惊魂

Cloudflare官方发言人表示,公司在周二一大早就观察到一项服务“异常流量激增”。主要问题表现为 "widespread 500 errors" 和"internal server error",这两大问题均直指服务器端错误,前者是大范围出现的500错误,后者是500错误的标准定义(即 “内部服务器错误”)。

援引CNBC消息,在Cloudflare网络修复过程中,Cloudflare表示它在英国伦敦禁用了WARP访问。对于那些试图通过WRP访问互联网的人来说,他们将无法连接。

作为全球网络的 “隐形守护者”,

Cloudflare却频繁“翻车”

总部位于美国旧金山的 Cloudflare,是全球领先的 CDN(内容分发网络)与网络安全服务提供商,业务覆盖全球数十万家企业,扮演着网站与终端用户之间的 “安全缓冲器” 角色,核心功能是抵御 DDoS 攻击、保障网络访问速度与稳定性。

Cloudflare客户群体包括 10% 的财富 1000 强企业,服务覆盖全球 10 亿级 IP 地址,承载着全球互联网近 10% 的骨干网流量,堪称互联网基础设施的 “命脉级” 企业。近年来该公司积极布局 AI 领域,推出 NLWeb 协议与 AutoRAG 检索引擎,深度绑定 OpenAI 等 AI 巨头的服务分发网络。

作为全球网络的 “隐形守护者”,Cloudflare近年来却频繁“翻车”。

2019年7月,Cloudflare软件的一个漏洞导致其部分网络耗尽全公司计算资源,致使全球数千家依赖其服务的网站最长宕机30分钟。

2022年6月,Cloudflare再次发生故障,波及19个数据中心故障,导致多家主流网站和服务陷入瘫痪,此次事故造成 1.5 小时服务中断。

2025年3月,Cloudflare因密码轮换错误其R2对象存储及相关服务发生了一次持续1小时7分钟的中断事件,事情导致全球范围内出现100%的写入失败和35%的读取失败。

此次故障再次暴露其在高风险操作流程上的管控漏洞,未严格执行双重验证与分阶段部署机制。

截至发文,Cloudflare因此次宕机事件致股价大跌4.27%,市值蒸发30.24亿美金。

美国网络安全问题频发

无独有偶,10月20日,亚马逊云DNS发生故障,导致全球服务瘫痪。

据悉,亚马逊 AWS 云服务发生的重大故障,引发了全球混乱,导致全球多家公司的网络连接出现问题,多个热门网站和应用服务中断。

AWS在其状态页面更新中确认,美国东部的多项AWS服务中出现错误率上升和延迟增加的情况。网络故障追踪平台“网络探测器”显示,亚马逊的购物网站、视频服务以及语音助手同期均出现问题。

每日经济新闻

突发,美国多个网站崩了!

11月18日,知名网络基础设施公司Cloudflare表示,其全球网络出现问题,导致许多网站和应用程序的服务中断,包括X(原twitter)和ChatGPT在内的多家互联网平台无法访问。据媒体报道,Spotify和亚马逊也出现了服务中断。

Cloudflare股价盘前一度下跌超5%。

xbUOr6jbzYLWricyYic2ooqCwU0Zbk4Nu9L1kfTCH4HoUFFDPiarzZ7wr3pUWaRtvLe4vbSeqVdTWJunRqzezBIfA.png

值得注意的是,18日晚,话题“cloudflare崩了”“推特崩了”登上微博热搜榜。

官网显示,Cloudflare是一个全球性的云平台,为世界各地的各种规模的企业提供广泛的网络服务,同时提高其关键互联网资产的性能和可靠性。Cloudflare还为全球125个国家/地区的330个城市提供数据传送服务。

新智元

AI杀死了AI!Cloudflare全球崩盘惨案,元凶已被原地解雇

【导读】一次「常规更新」搞崩半个地球,Cloudflare CTO紧急谢罪:我们搞砸了!Cloudflare自杀式Bug引发连锁反应,波及全球20%网站。当数百万爬虫撑爆了防御名单,Cloudflare的崩溃揭示了AI时代最深的基建隐忧,人类还能跟得上AI进化的脚本吗?

果然这个世界建立在脆弱性之上。

昨天,2025年11月18日,全球AI数字生态系统经历了一次近乎心跳骤停般的休克。

Cloudflare崩溃了!

然后全球五分之一的互联网服务几乎全部宕机,尤其是,AI巨头集体断网!ChatGPT、X全线崩盘!

当你还在拿着这个图调侃的时候。。。

殊不知,真正的情况是,Cloudflare现在互联网真正的底座。

马斯克在之前亚马逊宕机时还调侃,这次终于是风水轮流转!

只不过,老马没想到的是,这次CF的影响直接让自己家服务也宕机了~

Cloudflare的CTO赶紧发了个申明:是我们的错误,立正挨打。

下面会详细介绍这次引发故障的原因,简直就是草台班子级别,只能说人类社会用规则来和计算机打交道还是太脆弱了!

先说说这次事故的影响。

这起事故影响范围之广前所未见,被称为「半个互联网的停摆」毫不夸张——约20%的网站依赖Cloudflare提供服务

Cloudflare还有个称号叫做赛博活佛,特别是在极客群体中,很多服务,如果个人用都是免费的。

这里作为对比,必须夸一下咱们国内的基建服务了,不管是微信、B站、视频网站,你很少碰到如此级别大规模的故障。(ToB的服务不细讲,这个离普通消费者也很远)

故障高峰时,网站故障追踪平台Downdetector收到了累计逾210万条报错反馈,成为近年来最严重的基础设施级中断之一。

包括亚马逊、Spotify、Zoom、Uber等知名服务也受到波及(部分功能异常或加载缓慢)。

Cloudflare作为支撑全球海量流量的「隐形基建」,一次失误便牵一发而动全身,令股价盘中一度重挫约7%。

更令人深思的是,一些本用于监测网络故障的工具(如Downdetector)因本身也使用Cloudflare,甚至在事故中一同瘫痪—整个互联网生态对单一底层的依赖程度,由此可见一斑。

更「细思极恐」的是,当Cloudflare的工程师想要打开ChatGPT来修复故障时,AI也宕机了~

很多网友都形容那宕机的三个小时,如此「黑暗」,就像回到了远古时期。

Cloudflare这次导致全球断网的技术故障,其实是一次典型的「好心办坏事」。

网友们制作的恶搞图

简单来说,就是工程师试图升级安保系统的权限,却意外让负责安检的软件「吓晕」了。

(如果是AI来操作,以硅基同步的能力和运算的能力,大概率不会出这种岔子,这也就是碳基人类写下的固定规则才能导致了,还是人类规则太脆弱了。这里让我联想到马斯克为啥一直坚持FSD使用纯视觉,就是人类你不可能遍历所有驾驶过程,就像这次CF的故障,没有工程师能预先为这种场景写下规则)

根据Cloudflare官方博客的复盘,事情是这样发生的:

起因是系统「大扫除」。

工程师原本在进行一项常规的维护工作,目的是为了提高安全性。他们调整了数据库的权限,想把原本公用的「系统账号」改成责任更明确的「个人账号」。

然后这个看似无足轻重的操作,触动了隐藏在系统中「旧伤」。

系统里潜伏着一段很老的代码,它负责生成一份用来识别网络机器人的「特征名单」(Feature File)。

这段代码以前只在一个默认的数据库里找名单,所以没问题。

但这次权限升级后,它突然能看到另一个备份数据库了。

由于代码里没写清楚「只看哪一个」,它傻乎乎地把两边的名单都抓取了过来,名单被「膨胀」了。

这导致那份原本精简的「特征名单」瞬间膨胀,内容重复了一倍。

结果就是,保安「罢工」。

Cloudflare负责在全球各地转发流量的核心软件有一个硬性规定:为了保证速度,名单长度不能超过200条。

当这份意外「发福」的名单被推送到全球服务器时,软件发现名单太长读不完,直接触发了内存溢出保护机制(Panic),也就是彻底崩溃。

为了安全起见,它切断了所有连接。

简单说就是,本来机器数据库权限不够,调整后,它突然权限高了点,然后也没有为这个情况提前写下判断代码。

打个再通俗的比方(可能不是那么准确)。

这就好比大楼物业给保安发了一副新眼镜(升级权限),本意是让他看得更清楚。

结果因为新眼镜度数没调好,保安看手里的「访客黑名单」时出现了重影,原本100人的名单在他眼里变成了200人。

保安的脑容量(系统限制)记不住这么多人,瞬间由于信息过载而「死机」晕倒,导致大楼门禁系统自动锁死,把所有访客(包括X和ChatGPT的用户)都关在了门外。

不过目前问题已经修复了(其实不是啥大问题,就是逻辑改改就行)。

如果不只是把这次事故看作一个单纯的技术故障,而是放在2025年「AI疯狂吞噬数据」的背景下去看,你会发现这充满了黑色的讽刺意味。

AI杀死AI

导致这次崩溃的核心组件是「机器人管理系统(Bot Management)」。

在2025年,这个系统的主要假想敌是谁?正是AI爬虫。

随着大模型训练对数据的极度渴求,互联网上充斥着无数自动化的AI抓取程序。

Cloudflare作为「守门人」,必须不断升级其算法来区分「真人」和「AI机器人」。

特征文件(Feature File),对就是报告中提到的那个导致崩溃的「特征文件」,实际上就是机器学习模型用来判断流量性质的「参数集」。

每一个「特征(Feature)」都是一个判断维度(比如鼠标移动轨迹、点击频率、IP行为模式等)。

为了应对越来越狡猾的AI机器人,Cloudflare的防御系统变得越来越复杂,需要调用的「特征」越来越多。

这次故障的直接原因就是数据库错误地吐出了过多的特征数据,导致防御系统的「大脑」过载

这不是一次普通的软件崩溃,这是「数字免疫系统」在试图升级以对抗AI病毒时,因自身的排异反应而休克。

这次事件最荒诞的地方在于受害者名单

OpenAI、xAI、Perplexity这些是全球最大的AI公司,它们同时扮演了两个角色:

它们的爬虫在全网搜刮数据,迫使Cloudflare建立更复杂的防御系统(即这次崩溃的源头)。

它们自己也极其依赖Cloudflare来防止被别人攻击或滥用。

结果呢?

Cloudflare为了防御AI抓取行为而维护的系统,因为一次配置错误,反过来「杀死了」最顶级的AI服务商。

这就像是为了防止野兽入侵而把城墙修得太高太重,结果城墙倒塌,把住在城里的国王(AI巨头)给压垮了。

这揭示了AI时代基础设施的内卷化困境——为了对抗技术的滥用,我们不得不把基础设施造得越来越复杂、越来越脆弱。

你问这和AI有什么关系,或许这就是AI时代的「技术债」。

这里有一个更深层的隐喻:「特征膨胀」

在传统的软件工程中,逻辑通常是线性的。

但在涉及AI和机器学习的防御体系中,系统依赖于成百上千个「特征」来进行概率判断。

这次故障是因为特征数量突破了200个的硬编码限制而引发的。

这暴露了一个问题:我们正在构建一种人类难以完全掌控的「黑箱基建」。

为了拦截智能程度极高的AI机器人,防御规则不能再是简单的黑白名单,而必须是动态的、基于行为分析的复杂模型。

这种复杂度的指数级上升,意味着未来类似的「不可预测的崩溃」会越来越多。

我们正在用复杂的AI(防御)去对抗复杂的AI(进攻),而夹在中间的,是脆弱的物理互联网。

这次宕机不仅是一个配置错误,它是人类互联网为了适应AI寄生而进行的一次痛苦痉挛。

它是「矛」(AI抓取)与「盾」(AI防御)在无限升级的军备竞赛中,把战场(互联网基础设施)给撑爆了。

但是,这波也有用AI来打败AI的正面例子。

比如,吴恩达团队就在Cloudflare宕机的过程中,用AI快速实现了Cloudflare功能的克隆版本,成为最早一批恢复运行的网站。

属实是用魔法打败魔法了!

最后再放一个彩蛋。

彩蛋:元凶被原地解雇

X上这位名为Rob Hallam的哥们发了个帖子。

说他正是那位搞崩全球互联网的工程师(可能是之一)。

自称是,能用单个正则表达式让20%互联网瘫痪,哈哈哈🤣

原文:

史诗级宕机!CDN霸主Cloudflare全球网络崩了:OpenAI、X、Uber等平台服务瘫痪,集体失联_凤凰网

突发,美国多个网站崩了! | 每经网




AI杀死了AI!Cloudflare全球崩盘惨案,元凶已被原地解雇


 

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值