核心维度与详细指标
1. 服务与进程状态
这是最基础的维度,确保备份软件本身在正常运行。
-
备份服务/守护进程状态:核心服务(如
Veeam Backup Service,NetBackup PBX,CommServe)是否正在运行。 -
相关组件状态:代理(Agent)、网关服务器(Gateway Server)、存储库服务(Repository Service)等关键组件的健康状况。
-
许可证状态:许可证是否有效、即将到期或已过期。
2. 备份任务执行状态
这是最受关注的维度,直接反映备份作业的成功与否。
-
任务结果:成功、失败、完成但有警告、正在运行、已排队、已停止。
-
任务进度:对于正在运行的任务,显示已完成百分比、已处理数据量、估计剩余时间。
-
任务持续时间:与历史平均时间对比,识别性能异常。
-
任务吞吐率:MB/秒 或 GB/小时,是衡量性能的关键指标。
-
最后运行时间:上一次成功/失败/任何执行的时间戳。
3. 数据与存储状态
这个维度关注备份数据的完整性、安全性和存储资源。
-
存储库/存储单元状态:备份存储目标(磁盘、云存储、磁带库)是否可访问、在线。
-
存储空间利用率:已用容量、剩余容量、使用率百分比。设置关键阈值(如 80% 警告,90% 严重)。
-
备份链完整性:检查合成完整备份、增量备份链是否完整,有无断裂或损坏。
-
数据完整性校验结果:定期进行的备份文件验证(如 SureBackup,
vmkfstools -v)是否通过。 -
加密与安全状态:备份数据是否已按策略加密,加密密钥是否可用。
4. 源数据与目标连接状态
确保备份源和备份目标之间的通信畅通无阻。
-
与源系统的连接:与虚拟机监控程序(vCenter/ESXi)、数据库(Oracle, SQL Server)、文件服务器等的连接状态和认证状态。
-
与目标存储的连接:与备份存储(S3兼容存储、Azure Blob、磁带驱动器)的连接状态和延迟。
-
代理通信状态:安装在源服务器上的备份代理是否“心跳”正常,可被主服务器访问。
5. 性能与资源指标
帮助诊断备份速度慢、资源瓶颈等问题。
-
网络带宽占用:备份过程中的网络流入/流出速率。
-
CPU/内存利用率:备份服务器、代理服务器、存储库服务器的资源消耗。
-
磁盘I/O:备份存储的读写速率、IOPS和延迟。
-
数据处理速率:在源端去重、压缩、加密的速率。
6. 策略与配置合规性
从管理角度确保备份策略被正确执行。
-
策略符合性:所有需要备份的客户端/虚拟机是否都分配并执行了正确的备份策略。
-
备份SLA达标率:是否在规定的备份时间窗口内完成。
-
保留策略执行情况:过期的备份文件是否按策略被正确删除,以释放空间。
-
配置变更历史:近期是否有影响备份的关键配置被修改。
7. 恢复就绪状态
备份的最终目的是恢复,这个维度直接评估恢复能力。
-
可恢复性验证:通过自动化的恢复测试(如沙箱恢复)验证备份数据的可恢复性。
-
恢复点目标达成情况:实际恢复点(RPO)与业务要求的RPO的差距。
-
可用恢复点列表:对于特定数据源,存在哪些时间点的有效备份,可以用于恢复。
1771

被折叠的 条评论
为什么被折叠?



