
大数据性能测试的目的
1.大数据组件的性能回归,在版本升级的时候,进行新旧版本的性能比对。
2.在新版本/新的生产环境发布之后获取性能基线,建立可度量的参考标准,为其他测试场景或者调优过程提供对比参考。
3.在众多的发行版本中进行测试比对,为PoC测试提供参考数据。
4.支持POC测试,得出结论,到时候可以根据业务模型和需求,或者根据客户需求选择不同的方案。
5.在客户方进行性能测试,达到客户要求的性能标准满足客户使用的需求。
性能测试的时机
-
上线新版本
-
上线新的环境/新的主机
-
开辟了新的区域
-
PoC 测试
-
性能专项测试
性能测试的步骤
明确测试的目标
确定性能测试场景,集群规模和规格,数据量,数据格式,压缩算法等。
比如:
-
版本迭代测试,需要和历史版本集群规格和参数对齐,以便比较版本性能是否劣化;
-
Poc测试需要明确客户场景;
-
软件发行商测试,需要与发行商集群规模保持一致。
申请主机环境和测试周期
搭建运行环境和监控
获取的性能指标,部分包含:性能数据,比如带宽、磁盘IO、CPU、内存等指标。
开展测试
测试过程中使用nmon或者其他系统监控的工具记录系统指标变化,以供发现系统瓶颈,利于后续调优。
针对性能结果进行调整优化
进行迭代性能测试。
出具性能测试报告
大数据组件测试工具和方法

除了上述主流的大数据主键外还有Hbase等,除了主流的测试工具Hibench之外还有雅虎的大数据测试套件。
大数据性能调优
在大数据领域普遍存在数据倾斜的问题,需要参考对应组件的官方文档以及参考业界的案例介绍。
大数据相关的测试
基准测试
单一用户单个事务的测试,目的是在对选择的用户在无压力的情况下获取系统处理单个请求的情况。
负载测试
通过逐步增加系统的负载,测试系统性能的变化。
稳定性测试
通过给系统加载一定的业务压力,运行7*24 小时,以此检测系统是否稳定运行。
功能测试
特别是在OLAP引擎选择的时候,需要测试其对标准SQL支持的情况,如部门不支持update和delete操作、不支持with语句、不支持except和intersection操作等。
性能需求
CPU、内存、磁盘IO、网络负载使用率不超过80%,响应时间90%的读取、写入、导出、导入不超过3s,有不到10%的响应时间不超过5s。
测试案例
1.在不同数据量(100G、500G 、1T)分别对Hadoop和spark进行读取、数据写入、数据导出 数据导入基准测试。
2.在不同数据量下进行并行和读写混合测试。
3.在不同数据量下进行7*24小时的数据稳定性测试。
测试观察指标
-
CPU 使用率
-
内存使用率
-
IO
-
网络
-
响应时间
-
其他指标
行动吧,在路上总比一直观望的要好,未来的你肯定会感谢现在拼搏的自己!如果想学习提升找不到资料,没人答疑解惑时,请及时加入群: 759968159,里面有各种测试开发资料和技术可以一起交流哦。
最后: 下方这份完整的软件测试视频教程已经整理上传完成,需要的朋友们可以自行领取【保证100%免费】
软件测试面试文档
我们学习必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有字节大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

https://blog.youkuaiyun.com/AI_Green/article/details/134931243?spm=1001.2014.3001.5502
4763

被折叠的 条评论
为什么被折叠?



