1、类别变量与数值变量
首先变量中可以分为两类:类别变量(Category Variables)和数值变量(Numeric variables)。两者之间的区分不是绝对的,可以实现相对转化。比如成绩属于数值型变量,但是如果按照优良中差进行划分,就会变成类别变量;工种变量属于类别变量,但是类别数量过多时候在进行分析时就会被看做数值变量,比如航母中工种较多,就会出不同编号对应不同工种的情况。
1.1 论文中类别变量与连续变量的使用
定义:频数分析是针对单个变量(类别变量)的分析,分析得到的结果是不同类别(不同取值区间)的频数(frequency),以及频数对应的百分比(percentage)/或者是累计百分比(cumulative percentages),见下表和下图(左)。
如果是连续变量,一般是会按照取值区间进行划分形成类别变量,比如事故发生时间变量,会按照不同的时间范围进行划分,见下图(右)。
表格来源:
景国勋,刘孟霞.2015-2019年我国煤矿瓦斯事故统计与规律分析[J/OL].安全与环境学报:1-8[2022-06-28].DOI:10.13637/j.