用boxplot看数据分布的时候发现总会自动筛选出外点,一大堆红点没法看,还以为用了什么算法呢,实际上很简单,仔细看看官方文档就行了:
用箱线图可视化汇总统计量 - MATLAB boxplot - MathWorks 中国
boxplot将大于 q3 + w × (q3 – q1) 或小于 q1 – w × (q3 – q1) 的点绘制为离群值,其中 w 是乘数Whisker,而 q1 和 q3 分别是样本数据的第 25 个和第 75 个百分位数。
所以要设置Whisker的参数,用于计算最大虚线长度的乘数,这个数越大,须线就越长,外点也就越少。
举例:
boxplot(data,'Whisker',10);
博客介绍了如何使用MATLAB的boxplot函数来可视化数据分布,并重点讲解了如何通过调整Whisker参数来控制外点的显示,以及外点的计算逻辑。设置合适的Whisker值可以减少外点的数量,从而更清晰地展示数据的分布情况。例如,通过设置'Whisker'为10,可以延长须线长度,减少标记为离群值的点。
6017

被折叠的 条评论
为什么被折叠?



