性能基准评估检查表

本文探讨了在执行基准测试时需要考虑的关键问题,包括理解性能限制、检查是否突破系统瓶颈、关注错误率、重现性测试以及系统扰动的影响。通过主动基准测试和深入分析,可以识别并解决性能问题,提高系统效率。

[TOP]

做、评估一个基准测试时,思考以下问题

1、为什么不翻倍呢

如果基准测试报告一秒钟执行20000次,你应该问:为什么不是每秒40000次呢。这里面真正的问题是**“限制是什么?”**

这就像一个纯学术价值的家庭作业。找到“为什么不加倍”的答案,可能会激励每个人取寻找和修复这个限制,并使基准测试的结果加倍!

回答这个问题,通常需要在基准运行时,同时使用其他可观察性工具进行分析(我称之为“主动基准测试”)

2、是否突破了限制?

这是一个明智的测试。我曾经批评了很多基准测试,指出他们需要的网络吞吐量已经远远超过了最大网络(有的甚至高达十倍)。网络、PCle总线、CPU互联、内存总线和存储设备(吞吐量和IOPS)都有固定的限制。网络是最容易检查的。在某些情况下,基准可能看起来超过网络带宽,因为它从本地内存缓存而不是远程目标返回。如果您测试一个已知大小的数据传输,并显示他们的速率,您可以做一个简单的求和来查看所需要的最小吞吐量,然后将其与网络连接进行比较。

3、是否出错了?

操作出错的百分比是多少?0%?1%?100%?基准可能配置错误,也可能是压力测试将目标推到错误诱导的极限。错误的执行方式与正常操作不同,因此高错误率会使基准发生偏差。如果您养成了只从一个冗长的基准测试报告中读取操作速率和延迟数字的习惯(或者您有一个shell脚本来完成这项工作,并为GUI提供数据),那么很容易忽略报告中的其他细节,例如错误率。

4、它能再现吗?

如果您运行基准测试十次,结果的一致性如何?可能存在偏差(例如缓存)或者扰动(例如系统的定时任务),这些偏差会扭曲单次基准测试的结果。

检查系统扰动的一种方法是通过负载平均值:在开始基准测试之前让它们达到"0.00 0.00 0.00",如果它们没有达到零,调试并找出原因。

5、

6、

根据原作 https://pan.quark.cn/s/459657bcfd45 的源码改编 Classic-ML-Methods-Algo 引言 建立这个项目,是为了梳理和总结传统机器学习(Machine Learning)方法(methods)或者算法(algo),和各位同仁相互学习交流. 现在的深度学习本质上来自于传统的神经网络模型,很大程度上是传统机器学习的延续,同时也在不少时候需要结合传统方法来实现. 任何机器学习方法基本的流程结构都是通用的;使用的评价方法也基本通用;使用的一些数学知识也是通用的. 本文在梳理传统机器学习方法算法的同时也会顺便补充这些流程,数学上的知识以供参考. 机器学习 机器学习是人工智能(Artificial Intelligence)的一个分支,也是实现人工智能最重要的手段.区别于传统的基于规则(rule-based)的算法,机器学习可以从数据中获取知识,从而实现规定的任务[Ian Goodfellow and Yoshua Bengio and Aaron Courville的Deep Learning].这些知识可以分为四种: 总结(summarization) 预测(prediction) 估计(estimation) 假想验证(hypothesis testing) 机器学习主要关心的是预测[Varian在Big Data : New Tricks for Econometrics],预测的可以是连续性的输出变量,分类,聚类或者物品之间的有趣关联. 机器学习分类 根据数据配置(setting,是否有标签,可以是连续的也可以是离散的)和任务目标,我们可以将机器学习方法分为四种: 无监督(unsupervised) 训练数据没有给定...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值