控制图(control chart)以及评估指标(ARL、ATS)

本文介绍了控制图在统计过程控制中的重要作用,包括均值控制图、方差控制图及联合控制图等类型,探讨了静态与动态控制图的区别,如FSR、VSR、VSS、VSI和VSSI控制图。并提到了Shewhart、CUSUM和EWMA等常见控制图,以及评价控制图效果的ARL和ATS指标。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

控制图也称为“质量管理图”、“质量评估图”。控制图在研究统计过程控制(Statistical Process Control, SPC)中占有很重要的作用,并且在实际中得到了很好的应用,也取得了很好的经济效益。

常见的控制图分类

控制图可以按照其检测的统计量进行分类,如果仅对均值的检测感兴趣,则称为均值控制图;如果仅对方差的检测感兴趣,则称为方差控制图;如果对二者均感兴趣,则称为关于均值与方差的联合控制图。
控制图也可以按照抽样时间间隔和样本容量是否固定进行分类,如果在检验的过程中,抽样的时间间隔和样本容量固定不变,则称为相应的控制图为静态(static)或者固定抽样率(Fixed Sampling Rate, FSR)的控制图,否则就称为动态(adaptive)或者变化抽样率(Variable Sampling Rate, VSR)控制图,而对于VSR控制图,如果抽样时间间隔不变,而每次抽取的样本容量在变化,则称为变化样本容量(Variable Sample Size, VSS)控制图;如果抽取的样本容量不变,而每次抽样的时间间隔发生变化,则称为变化抽样区间控制图(Variable Sampling Interval, VSI)控制图;如果两者都发生变化则称为变换样本容量以及抽样区间(Variable Sample Size and Sampling Interval, VSSI)控制图。
用思维导图来整理一下上面的分类:
在这里插入图片描述
常见的几种控制图有:

  • Shewhart,这个控制图是由Shewart博士基于3σ3\sigma3σ原理突出的,它对于较大的漂移(shift)效果明显。
  • CUSUM(Cumulative Sum)控制图对于漂移较小的情况检测效果较好。
  • EWMA(Exponentially Weighted Moving Average)控制图是基于指数移动平均值来检测漂移。

除了上面的几种控制图,现在已经有很多新的研究成果和理论提出,具体可以去参考相关论文。

评价控制图质量好坏的指标

对于FSR控制图,我们称从检测开始到它发出警报而止而抽取的平均样本数目为平均运行长度(Average Run Length, ARL);对于VSI控制图来说,我们称从检查开始到它发出警报为止的平均运行时间为平均报警时间(Average Time to Signal, ATS);对于VSS控制图而言,我们称从检测开始到它发出警报为止的平均抽取样本个数为平均样本数(Average Number of Samples, ANOS)。

在没有任何漂移出现之前,这个过程称作是可控的(in-control),否则就称为失控的(out-of-control)。所以说在衡量控制图好坏的效果时,ARL或者ATS都是很重要的指标,理想情况下,二者越小越好

ARL和ATS计算方法

ARL和ATS的计算方法有三种:马氏链法、积分方程法和随机模拟法。

REF

《ARL计算方法综述》

### COCO 数据集评估指标 #### 1. 平均精度 (Average Precision, AP) 平均精度是目标检测中最常用的性能衡量指标之一。它通过计精确率-召回率曲线下的面积来量化模型的表现。对于COCO数据集,AP被进一步细分为多个子类别以适应不同的场景需求。 - **AP@[IoU=0.50]** 表示当交并比(Intersection over Union, IoU)阈值设定为0.5时的平均精度[^1]。 - **AP@[IoU=0.75]** 则是在更严格的条件下(IoU=0.75),用于测试高重叠区域内的准确性[^2]。 - **AP@[IoU=0.50:0.95]** 是综合考虑从0.5到0.95之间一系列IoU阈值的结果,通常作为整体表现的主要参考依据。 #### 2. 不同尺度对象上的表现 除了总体AP之外,COCO还特别关注模型在处理各种大小物体方面的能力: - **APS**(Small objects): 针对小型物体(<32像素宽高的边界框)。 - **APM**(Medium objects): 中型物体(介于32至96像素之间的边界框)。 - **APL**(Large objects): 大型物体 (>96像素宽度高度的边界框)[^1]。 这些细分可以帮助研究人员更好地理解其法在哪种类型的实例上工作得更好或者存在不足之处。 #### 3. 召回率 (Recall) 召回率也是另一个重要的评价维度,在某些应用场景下可能更加重要。类似于AP,也有基于不同IoU水平定义的一系列recall数值: - **AR@[Max Detections=1]** 当最多允许预测一个box时的最大召回率。 - **AR@[Max Detections=10]** 和 **AR@[Max Detections=100]** 分别对应着更多数量上限情况下的最佳效果展示。 同样地,针对不同程度的对象尺寸也提供了相应的统计项如ARS、ARM和ARL分别表示small、medium及large size object recalls. #### 图像分割中的mAP扩展 对于语义/实例级别图片分隔任务而言,mAP概念得到了延续与发展。例如Mask R-CNN这样的框架不仅能够定位bounding boxes而且还能生成高质量mask masks因此引入额外度量用来评估segmentation quality比如pixel accuracy or mean IOU per class etc. ```python def calculate_map(precision_recall_curve): """ 计给定PR曲线下方的面积即MAP 参数: precision_recall_curve(list of tuples): [(precision_value, recall_value), ... ] 返回: float: MAP 值 """ sorted_by_second = sorted(precision_recall_curve, key=lambda tup: tup[1]) precisions = [item[0] for item in sorted_by_second] recalls = [item[1] for item in sorted_by_second] # 使用梯形法则近似积分 area_under_curve = sum((recalls[i+1]-recalls[i])*(precisions[i]+precisions[i+1])/2 for i in range(len(recalls)-1)) return area_under_curve ``` 上述函数展示了如何根据一组精确率与召回率点位来估出对应的MAP得分。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值