运维工程师节前必做工作
国庆将至,作为一名云计算运维工程师,节前需做好哪些工作就可以安心度假了?
云计算运维工程师一般以云平台上运行的各类应用系统为运维对象,应用系统组成比较复杂,包括了应用程序本身,还包括操作系统、数据库、网络资产、安全设施和云计算平台等技术层级。保障应用系统的稳定,其实就是保障上述这些各个层级的软硬件系统的稳定。如下我们将以部署在公有云上的应用系统为场景,介绍一下主要的工作要点。
节前须做的几项工作:
1、首先使用一套行之有效的状态监控工具,可以实时查看上述各个技术层面的系统运行状态,比如查看应用访问状态、系统磁盘空间、内存占有率、网络占有率等内容,并确保监控工具本身是正常工作的。公有云厂商的云监控系统,可以有效监控各个技术层级的运行状态。
2、其次使用一套比较全面的安全工具,可以实时检测系统、应用、数据库、云平台的各类安全漏洞和问题,并列出高风险漏洞,及时进行安全修复工作。公有云厂商的云安全中心可以全面掌握系统安全状态,并具备安全修复能力。
3、查看重要应用系统的数据备份策略情况,以及检查是否备份,如果有条件可以尝试进行备份恢复测试,验证备份数据是可以恢复的。公有云厂商的自动快照策略,可以有效实现数据备份,并通过镜像功能实现数据恢复。如下图所示,是公有云上常见的自动快照备份策略:
4、针对应用系统定义好监控告警指标策略,若有条件可以验证一下告警策略是否是有效。根据不同应用系统访问方式和系统组成,定义不同的监控告警指标策略。如下图示例是云服务器的常见监控指标设置:
5、针对常见的安全问题或事件,可以提前定义安全应急预案,并进行安全应急演练,确保在发生重大安全事件或问题时候,可以实现有效的应急处置和系统恢复。
北京环宇数通科技有限公司
--云网数智安一体化服务商
联系电话:4008-693-878
官方网址:www.sotote.com
联系地址:北京市海淀区上地三街9号F座506