现分享消息队列集群机制有效性之磁盘繁忙测试场景:
测试目的:
考察消息队列集群集群节点异常(磁盘繁忙)的情况下,对业务的影响。
测试步骤:
1.按照混合测试场景中交易比例,以系统最大处理能力的50%作为负载压力向消息队列集群施压,场景稳定运行5分钟;
2.运行大量读写脚本,制造磁盘繁忙场景,场景持续稳定运行5分钟,观察场景中交易状态、处理能力、响应时间情况;
3.停掉读写脚本,IO恢复正常,场景继续稳定运行5分钟,结束测试;
4、观察各交易错误率、处理能力、响应时间,监控被测服务器资源使用情况。
预期结果:
1、步骤2后,发往磁盘繁忙节点的交易失败,响应时间变长,总TPS值降低,集群内其它节点的交易不受影响;1分钟内,其它集群节点接管故障节点,交易响应时间及总处理能力值恢复正常;
2、步骤3后,1分钟内,恢复后的故障节点能够重新处理交易,交易响应时间及总处理能力值恢复正常;
3、期间各服务器资源未出现长期高位现象(CPU>80%,持续时间超过1分钟)。
监控点:
记录切换时间,监控交易的响应时间、成功失败交易数、交易失败原因、系统处理能力(TPS)、各服务器资源使用情况。
测试指标:
1.失效交易处理能力恢复水平(%)为100%;
2.平均失效恢复时间MTTR(秒)不大于60秒;
3.应用集群机制有效性有效。