定量变量可以分为离散变量和连续变量。
类别变量
类别变量包含有限的类别数或可区分组数。类别数据可能不是逻辑顺序。例如,类别变量包括性别、材料类型和付款方式。
离散变量
离散变量是在任意两个值之间具有可计数的值的数值变量。离散变量始终为数值变量。例如,客户投诉数量或者瑕疵或缺陷数。
连续变量
连续变量是在任意两个值之间具有无限个值的数值变量。连续变量可以是数值变量,也可以是日期/时间变量。例如,零件的长度,或者收到付款的日期和时间。
如果您有离散变量而且想要将其包括在回归或方差分析模型中,可以决定是将其视为连续预测变量(协变量),还是类别变量(因子)。如果离散变量具有许多水平,那么最好将其视为连续变量。将预测变量视为连续变量意味着简单线性或多项式函数足以描述响应和预测变量之间的关系。当您将预测变量视为类别变量时,离散响应值将与变量的每个水平拟合,而不必考虑预测变量水平的顺序。使用此信息,除了可以进行分析以外,还可以确定哪个变量最适合您的情况。
本文介绍了统计学中的两类数值变量——离散变量和连续变量,包括它们的定义和实例。离散变量是具有可计数值的变量,如投诉数量;而连续变量则在任意两点间有无限个值,如长度或时间。在建模时,离散变量可被视为连续或类别变量,选择取决于其水平数和分析目的。正确的变量处理对于回归或方差分析模型的构建至关重要。
3299

被折叠的 条评论
为什么被折叠?



