【科研数据处理】[基础]类别变量频数分析图表、数值变量分布图表与正态性检验(包含对数正态)

本文探讨了科研数据处理中的类别变量与数值变量分析,包括频数分析、帕累托图、交叉表、正态分布判定、偏态分布和对数正态分布。通过直方图、箱型图和帕累托图展示数据分布,并介绍了正态性检验方法如K-S和S-W检验,强调了偏态分布的识别与对数正态分布的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、类别变量与数值变量

首先变量中可以分为两类:类别变量(Category Variables)和数值变量(Numeric variables)。两者之间的区分不是绝对的,可以实现相对转化。比如成绩属于数值型变量,但是如果按照优良中差进行划分,就会变成类别变量;工种变量属于类别变量,但是类别数量过多时候在进行分析时就会被看做数值变量,比如航母中工种较多,就会出不同编号对应不同工种的情况。

1.1 论文中类别变量与连续变量的使用

定义:频数分析是针对单个变量(类别变量)的分析,分析得到的结果是不同类别(不同取值区间)的频数(frequency),以及频数对应的百分比(percentage)/或者是累计百分比(cumulative percentages),见下表和下图(左)。
在这里插入图片描述
如果是连续变量,一般是会按照取值区间进行划分形成类别变量,比如事故发生时间变量,会按照不同的时间范围进行划分,见下图(右)。
在这里插入图片描述
表格来源:
景国勋,刘孟霞.2015-2019年我国煤矿瓦斯事故统计与规律分析[J/OL].安全与环境学报:1-8[2022-06-28].DOI:10.13637/j.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lys_828

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值