
核心基础设施故障引发全球连锁反应
2025年11月18日,互联网基础设施服务商Cloudflare发生大规模服务中断,导致全球范围内众多知名网站和平台出现间歇性故障。此次故障源于内部服务降级,触发了HTTP 500错误,影响范围涵盖Cloudflare控制面板、API接口及核心网络服务,造成全球数百万用户遭遇部分服务中断。
故障时间线与恢复进展
Cloudflare于UTC时间11:48首次确认故障,表示正在经历内部服务降级,部分服务间歇性受影响,承诺尽快恢复功能。UTC时间12:03,公司仍在调查问题;12:21更新称服务开始恢复,但客户可能遭遇高于常规的错误率;截至UTC时间12:37,调查仍在继续,当天傍晚前尚未宣布完全解决。具有讽刺意味的是,Cloudflare自身状态页面在故障高峰期也无法访问,导致用户无法获取实时更新。
全球互联网服务集体瘫痪
此次故障产生连锁反应,波及依赖Cloudflare内容分发网络(CDN)、DDoS防护和DNS服务的各类平台:
- 社交媒体平台X(原Twitter)出现区域性访问故障,用户报告加载失败并显示Cloudflare内部服务器错误。故障监测平台Downdetector记录到超11,000份报告,其中61%来自移动应用,28%来自网站
- OpenAI的ChatGPT和Perplexity AI等人工智能服务对多数用户不可用,显示Cloudflare错误页面并提示稍后重试
- 其他受影响服务包括设计工具Canva、音乐平台Spotify、游戏平台《英雄联盟》和Discord、电商网站Shopify、博客平台Medium以及依赖Cloudflare基础设施的加密货币交易所
- 影视评论网站Letterboxd和故障追踪平台Downdetector自身也受到影响,随着全球报告激增进一步加剧用户不满
基础设施维护加剧故障影响
洛杉矶(UTC 10:00-14:00)、亚特兰大(UTC 11月18日07:00至19日22:00)、圣地亚哥(UTC 12:00-15:00)和大溪地(UTC 12:00-16:00)等数据中心的计划维护可能加剧了延迟问题,流量重路由进一步导致混乱。此外,Cloudflare支持门户因第三方供应商问题遭遇独立故障,虽不影响响应处理但阻碍了案例查看。
截至IST时间18:24,根据状态页面显示恢复工作仍在进行,多数网站已恢复稳定,但欧洲、北美和亚洲等地区仍报告存在零星错误。Cloudflare强调正集中精力进行缓解,承诺在完全解决后提供详细说明,而用户在此期间转向替代服务。
近期云服务故障回顾
- 2025年10月20日:AWS美国东部1区(US-EAST-1)发生持续超15小时的中断,影响Slack、Atlassian和Snapchat等服务
- 2025年10月29日:Azure因DNS配置错误导致全球中断,影响Azure Front Door和CDN服务,造成全球连接超时和解析问题
Cloudflare最新更新[2025年11月18日 14:34 UTC]:已部署变更恢复控制面板服务,仍在努力消除对各类应用的广泛影响。
114

被折叠的 条评论
为什么被折叠?



