网络高可用性、恢复概念及性能监控全解析
1. 高可用性与恢复概念
在事件发生时才考虑相关政策和程序就太晚了,必须提前做好规划。业务连续性是首要关注点,它主要涉及组织为减少系统故障、网络故障或运营所需关键组件故障的影响而遵循的流程、政策和方法。
1.1 业务连续性规划(BCP)
BCP 是实施政策、控制和程序以抵消关键业务流程损失、中断或故障影响的过程,是确保在正常业务运营中断时关键业务功能(CBF)仍可执行的管理工具。关键业务功能是指在中断发生时必须立即投入运行的流程或系统,许多此类功能信息密集,需要访问技术和数据。
1.2 单点故障(SPOF)
评估业务可持续性时,要认识到灾难可能发生。应构建无单点故障或连接的基础设施,对于小公司管理员来说,路由器/网关可能是单点故障点,需识别所有关键节点和资产,消除单点故障的最佳方法是增加冗余。
1.3 设备评估指标
每台设备都可以用平均故障间隔时间(MTBF)和平均修复时间(MTTR)来评估。MTBF 衡量系统或组件在固有故障之间预期或预测的故障发生率,MTTR 衡量故障发生后修复系统或组件所需的时间。
1.4 可用性相关技术
- 容错 :能够承受故障而不丢失数据,可通过 RAID、备份等技术实现,常见的容错 RAID 实现包括 RAID 1、RAID 5 和 RAID 10。
- 负载均衡 :将工作负载分布在多个服务器上,可提高网络性能、可靠性和可用性,负载均衡器可以是硬件设备或专门配置的软件。 </
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



