6、工程数据分析中的数据可视化方法

工程数据分析中的数据可视化方法

1. 数据预处理与箱线图基础

在进行数据可视化之前,有时需要对数据进行预处理。例如,将频率转换为百分比,使所有条形高度之和为 1,这样可以准确比较两个数据集。同时,为消除箱宽差异,可使用统一的箱宽。以下是示例代码:

h1.Normalization = 'probability';
h1.BinWidth = 10;
h2.Normalization = 'probability';
h2.BinWidth = 10;

箱线图是一种重要的数据可视化方式,它展示了数据集的五数概括,按升序排列分别为最小值、第一四分位数、中位数、第三四分位数和最大值。

1.1 箱线图的结构

  • 箱体 :箱体包含了数据集的中间一半数据,即约 50%的数据落在箱体内。第一四分位数(下四分位数)是 25%的分数低于该值,75%的数据高于它;第三四分位数(上四分位数)是 75%的分数低于该值,25%的数据高于它。箱体的长度代表四分位距,即上四分位数与下四分位数的差值。箱体中间的线表示样本中位数,第二四分位数(中位数)是一半数据值大于该值,一半数据值小于该值。中位数不一定在第一和第三四分位数之间,它的位置取决于数据集。
  • 须线 :从箱体两端延伸出的须线代表落在中间 50%之外的分数。须线从箱体两端延伸到样本的最大值和最小值,因此最小值和最大值标记在须线的端点。

1.2 箱线图的作用

箱线图能快速

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值