文章目录
一、前言
ISO 20000体系中的服务可用性、连续性有时候理解起来会比较困难。服务可用性、服务连续性和信息安全管理是三个密切关联但各有侧重的核心概念,共同确保IT服务的高质量交付。详细解释见下文。

二、服务可用性管理
2.1. 定义
服务可用性是指服务在需要时能够按约定性能正常运行的能力,通常以“可用时间占比”衡量(如99.9%可用性表示全年停机时间不超过8.76小时)。
核心目标
:确保用户能够按需访问和使用服务。
类比
: 就像银行ATM机——用户期望随时能取款,若机器故障(不可用),会直接影响用户体验。
如果运转率99.99%,则表示一年中不可用时间是:
一年中的小时数:365*24 = 8760小时 一年中1%不可用的时间对应小时数:8760小时 * 1% = 87.6小时
对应天数是:87.6 / 24 = 3.65天 如果运转率99.99%,则表示:一年中0.01%不可用的时间对应小时数:8760小时 * 0.01% = 0.876小时 对应分钟数是:0.876小时 * 60 =
52.56分钟(约等于52分钟)
可用性 | 年度故障/停止时间 |
---|---|
99% | 3.65天 |
99.9% | 8.76小时 |
99.99% | 52.56分钟 |
99.999% | 5.3分钟 |
2.2 关键要素
-
可用性指标
:如SLA中定义的“服务可用时间百分比”。 故障恢复时间(MTTR)
:从故障发生到恢复的平均时间。-
冗余设计
:通过备份服务器、负载均衡等技术减少单点故障。 -
监控与告警
:实时跟踪服务状态,触发告警并快速响应。
2.3 管理措施
服务设计阶段
:规划冗余架构(如主备数据库)。-
服务运营阶段
:定期维护、故障演练、自动化故障切换。
-
示例
: 某电商平台通过多可用区部署服务器,确保即使一个区域故障,服务仍可用。
三、服务连续性管理
3.1 定义
服务连续性是指在发生意外中断(如自然灾害、网络攻击)时,服务能够快速恢复并持续运行的能力,强调“中断后恢复的速度和完整性”。
-
核心目标
:最小化业务中断的影响范围和时长。 类比
:
就像医院的应急电源——停电时自动切换,确保手术室设备持续运行。
3.2 关键要素
业务影响分析(BIA)
:识别关键业务功能及其依赖的服务。灾难恢复计划(DRP)
:定义中断后的恢复步骤(如数据备份恢复)。-
容灾架构
:异地备份、云灾备等方案。 定期演练
:模拟故障场景,验证恢复流程有效性。
3.3 管理措施
-
服务设计阶段
:设计容灾架构(如跨地域集群)。 -
服务运营阶段
:定期测试备份恢复、更新灾难恢复预案。
示例
: 某银行核心系统采用“两地三中心”部署,确保任一数据中心故障时业务不中断。
四、信息安全管理
4.1 定义
信息安全管理是指保护信息的机密性、完整性和可用性,防止未经授权的访问、泄露或破坏,涵盖技术、流程和人员管理。
核心目标
:确保数据安全合规,降低信息泄露风险。
类比
: 就像保险柜——通过锁具(技术)、钥匙管理(流程)和安保人员(人员)保护财物安全。
4.2 关键要素
-
安全策略
:如访问控制、数据加密、日志审计。 -
风险评估
:识别漏洞和威胁(如弱密码、未打补丁的系统)。 事件响应
:制定应急预案(如数据泄露后的取证和修复)。 合规要求
:满足GDPR、等保2.0等法规。
4.3 管理措施
-
服务设计阶段
:集成安全设计(如默认启用HTTPS)。 服务运营阶段
:定期渗透测试、安全培训、更新防火墙规则。
-
示例
: 某医疗系统通过数据脱敏和双因素认证,保护患者隐私信息。
五、小结
服务可用性是“服务能正常用”,服务连续性是“中断后能用回来”,信息安全管理是“数据不被偷或破坏”。
三者共同构成IT服务的“铁三角”:可用性保障基础体验,连续性应对突发事件,信息安全管理筑牢安全防线。
就像银行的ATM机
> 可用性:机器正常吐钞(服务可用);
> 连续性:停电时备用电源启动(服务连续);
> 信息安全管理:摄像头监控和防撬设计(数据安全)。
纬度 | 服务可用性 | 服务连续性 | 信息安全管理 |
---|---|---|---|
核心目标 | 减少服务不可用时间 | 缩短中断恢复时间 | 防止数据泄露或篡改 |
关注点 | 服务正常运行 | 中断后的恢复能力 | 数据全生命周期安全 |
典型措施 | 冗余架构、负载均衡 | 容灾备份、灾难恢复演练 | 加密、访问控制、日志审计 |
关联流程 | 服务设计、事件管理 | 业务连续性管理、变更管理 | 风险管理、问题管理 |