小站的思考

当云服务出现故障导致数据中心起火时,文章提出了几点运维改进措施:1) 实施数据和应用多活策略,确保多数据中心服务连续性;2) 在预算有限时,采取限流措施分散流量;3) 跨云部署,增强业务韧性;4) 加强数据备份,确保数据安全。这些措施旨在提高系统稳定性和用户体验。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

那天还在加班的时候,两耳不闻窗外事的时候,朋友圈已经爆了,等我忙完后看朋友圈,已经是凌晨两点多钟啦。

坡站是放在云上的,云机房出了问题,数据中心起火了,应用被迫终止,短时间无法运行,这是意外的事情,不是坡站的运维人员能控制的,所以还得把锅扔给云平台。

那么除了云平台需要改进在,坡站的运维人员是否能有继续完善的地方呢?我想了想,撸了撸,还是有许多事情可以做的。

1、数据做多活,应用做多活,这个互联网一线大仓都已经做了,所以一个数据中心不能提供服务后,还有其它数据中心能提供服务,用户体验还是可以的,最多卡一分钟而已。

2、公司预算不够,做不了多活的话,那就要做限流措施了,尽可能把流量分发开来,不能下单总比下错单要好的。

3、要跨云部署,这样一个云出事情了,还有其它云来支撑一下业务服务。

4、运维人员要做好对数据的保护,全背和增量背都得有。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值