由于前一段时间家庭与工作都处于一个低迷的时期,导致我自己好像荒废了很久,学什么东西都很容易忘,可能是因为心不在焉吧!
说说正题吧,脚本测试之重要性
我想在很多公司应该都没有这方面的专职的测试人员吧,那就说说脚本测试的重要性,我看了一下目前运维团队管理的服务器快突破2万台了,所有的系统都在不同的服务器上运行着,如果运维脚本出现问题,那么可能导致的后果是不可估量的。
列如:网银交易和专业版网上支付交易量大幅下降事件,分析结果是有3台应用服务器的BServer句柄数溢出,监控程序发现句柄数溢出后自动重启了BServer,在此期间重启次数频繁且采取的是杀进程的方式,造成数据库的部分连接未释放,并进而造成数据库服务器的操作系统达到了最大进程数的限制,结果影响了交易。
列如:网上银行大众版交易量剧降、手机银行无法登录事件,分析结果是生产系统上有一个数据库监控脚本存在Bug,系统管理员在修复此脚本Bug并简单测试完成后,发布到了1000多台Linux服务器。新的监控脚本在对文件记录进行比对时,因文件较大,所以需要消耗较多的系统资源。监控脚本每分钟运行一次,当运行次数增多时,累积效应引发了服务器性能问题,最终影响到了手机银行、大众版等业务系统。
由上面的事件案例可以看出,如果一个运维脚本有bug,影响到服务器上的业务系统的话,后果很严重;一般运维类的脚本分为:巡检、监控、变更这几种。运行的方式分为:一直运行,一次性运行,计划运行等。脚本BUG潜伏期:脚本bug还有一个潜伏期,比如遇到对的时间或者对的人(其他关联的东西),它就会想不开,然后。。。
关于脚本测试的方法后面再写。