浅析数据中心宕机的几大因素

本文列举了因闰秒错误、松鼠破坏、服务器迁移失误等十大离奇原因导致的数据中心宕机事件,揭示了数据中心运营中可能遭遇的各种意外。

每隔一段时间就会有数据中心宕机的新闻出现,因为备份系统失败、或者技术人员出错等原因,数据中心宕机几乎已经成了常事。如今,随着行业的不断前进发展,中断已经变得不那么频繁,但尔仍然有偶出错的情况。有时,也有一些离奇的令人完全意想不到的原因导致数据中心停止运行。


业内十大离奇或者有点荒谬的原因导致数据中心宕机的事件:

闰秒错误

闰秒是指为保持协调世界时接近于世界时时刻,由国际计量局统一规定在年底或年中对协调世界时增加或减少1秒的调整。在2012年,原子钟问题导致IT系统出错,几个相当受欢迎的网站关闭,包括LinkedIn、Reddit、Mozilla和海盗湾。 在澳大利亚,澳洲航空航班被延误两个小时,航空公司不得不切换到手动签证。

松鼠破坏雅虎圣克拉拉数据中心

可爱的松鼠也会制造大麻烦?事实上,在一个数据中心出现一只松鼠不是那么罕见。他们咀嚼一切,包括那些用来传输通信信号的重要电线。雅虎方面指出,在2010年,松鼠咬断电线导致圣克拉拉数据中心一半服务器宕机。

迁移服务器

移动服务器可是件棘手的事情。 NaviSite(现在在时代华纳旗下)在2007年收购了一家叫做Alabanza的托管提供商,将客户账户从Baltimore的主要数据中心迁移到马萨诸塞州的Andover.

他们把不插电的服务器放在一辆卡车,车载着服务器行驶超过420英里。此事导致当时依靠Alabanza的一些网站无法访问,直到服务器重新安家并开始工作。

另一个move-related问题发生的几个月前,Hostway将其ValueWeb服务器从迈阿密搬到坦帕。Hostway后来说,搬迁后,超过500台服务器在重新启动时出现硬件故障。

船锚砸中海底电缆

海底电缆为大陆之间的联通带来便利。通常这些电缆能够持久的保持功用,在海底遇到的威胁也比较少。 然而,至少有一个实例,原因就是一个船锚掉在海底电缆上。

当时是2008年,势大力沉的船锚掉到海里,正好砸到了海底电缆上,虽然不一定造成数据中心宕机,但它确实在一些地区造成停机。

“凿壁偷光”

拉尔夫。瓦尔多。爱默生曾说过,“每一个墙是一扇门。 ”

来自丹麦的小偷团伙在Taastrup数据中心的墙壁上钻了一个大窟窿来偷东西。据新闻报道,他们偷走了一些网络卡。小偷是如何穿过数据中心墙,并且为什么他们这样做至今仍是一个谜。

小心扔烟头的位置

扔烟头至少曾造成一次数据中心宕机事件。

在澳大利亚西部的Perth iX数据中心关闭后一个小时,VESDA(早期烟雾探测装置)在数据中心系统检测到烟雾。原因被确认为一个从外墙设施的花园里扔进来的一个燃烧的烟头。

卡车大乱入

2007年,Rackspace公司phenominal正常运行时,一辆卡车驶入进来撞到了电力变压器,导致它爆炸了,随后设备中断数小时。

虽然备用电源试图发挥作用,但是两个制冷器偏偏这个时候启动失败。此举导致当时互联网上的很多大型网站无法访问。

互联网网关协议

Renesys在一份报告中表示,在2009年,由于身处捷克的几家大型ISP托管公司发布了一个错误的边界网关协议,导致全球互联网崩溃了超过一个小时。

Renesys监控互联网的每一个前缀并计算其稳定性,根据该网站的定位分析,美国受此次影响最大。事后反思,网络运营商显然应该多阅读他们的路由器文档,并测试任何拟议变化,在实验室环境中得到他们期望的结果再发布。好在互联网自我修复能力很强,短期内就恢复了正常。

超级风暴Sandy

超级风暴Sandy曾在纽约掀起了轩然大波。它强大的威力导致数据中心发生一连串的故障。

暴风雨接着风势不断向北前进,就像空急流风暴带着一把锋利的冰刀离开海岸。狂风暴雨的侵袭导致当地很多数据中心发生故障。

类似的离奇或偶然事件正分分钟在这个世界上的某些地方不断上演,生活比故事还要精彩,有些事情你就是无法预测到。

Bingdata优网助帮汇聚多平台采集的海量数据,通过大数据技术的分析及预测能力为企业提供智能化的数据分析、运营优化、投放决策、精准营销、竞品分析等整合营销服务。

北京优网助帮信息技术有限公司(简称优网助帮)是以大数据为基础,并智能应用于整合营销的大数据公司,隶属于亨通集团。Bingdata是其旗下品牌。优网助帮团队主要来自阿里、腾讯、百度、金山、搜狐及移动、电信、联通、华为、爱立信等著名企业的技术大咖,兼有互联网与通信运营商两种基因,为大数据的算法分析提供强大的技术支撑。

 

 

1 解决Oracle 9.2.0.6版本数据库由于ORA-07445宕机问题 故障现象: XX网数据库宕机,查看日志发现以下内容: Wed Jun 8 20:24:17 2005 Errors in file /u02/app/oracle/admin/unicom/udump/unicom_ora_661.trc: ORA-07445: \263\366\317\326\322\354\263\243: \272\313\320\304\327\252\264\242 [0000000101C3089C] [SIGSEGV] [Address not mappe d to object] [0x000000000] [] [] Wed Jun 8 20:24:22 2005 Errors in file /u02/app/oracle/admin/unicom/bdump/unicom_pmon_11598.trc: ORA-07445: exception encountered: core dump [0000000101C399A0] [SIGSEGV] [Address not mapped to object] [0x000000000] [] [] Wed Jun 8 20:24:23 2005 Errors in file /u02/app/oracle/admin/unicom/bdump/unicom_pmon_11598.trc: ORA-07445: exception encountered: core dump [0000000101C399A0] [SIGSEGV] [Address not mapped to object] [0x000000000] [] [] ORA-00602: internal programming exception ORA-07445: exception encountered: core dump [0000000101C399A0] [SIGSEGV] [Address not mapped to object] [0x000000000] [] [] Wed Jun 8 20:24:33 2005 CKPT: terminating instance due to error 472 Instance terminated by CKPT, pid = 11604 Wed Jun 8 21:04:47 2005 Starting ORACLE instance (normal) 解决办法: Oracle工程师建议安装Oracle补丁p3949307_9206_SOLARIS64,经过测试,安装步骤如下: (注意,首先shutdown数据库) 1,解压补丁文件 unzip p3949307_9206_SOLARIS64.zip 解开后的目录是:4060756 2,修改oraclehomeproperties.xml文件,该文件在$ORACLE_HOME/inventory/ContentsXML目录下。 cp oraclehomeproperties.xml oraclehomeproperties.xmlb.bak vi oraclehomeproperties.xml 更改数字453 ->23,存盘退出 3,修改PATH路径为 PATH=$ORACLE_HOME/bin:/usr/ccs/bin:${PATH} 4,执行opatch apply命令 cd 4060756 $ORACLE_HOME/OPatch/opatch apply 5,安装成功后会出现如下结果 Updating inventory... /oracle92/app/oracle/product/9.2.0.1/OPatch/opatch.pl version: 1.0.0.0.51 Copyright (c) 2001-2004 Oracle Corporation. All Rights Reserved. OPatch succeeded.
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值