连续化(Continuize)
将离散变量(属性)转换为数值型(“连续”)虚拟变量。
输入
• 数据:输入数据集
输出
• 数据:转换后的数据集
连续化小部件接收一个数据集作为输入,并输出经过转换的数据集。转换过程中,部分或全部分类变量会被替换为连续变量,数值型变量会被标准化。
操作步骤
-
选择分类属性并定义处理方式
选择一个分类属性以设置其特定处理方式,或点击上方的“默认”选项,为所有未单独设置的分类属性应用默认处理。支持多选。 -
定义分类变量的处理方式
假设有一个分类属性“状态”(status),其取值为低(low)、中(middle)、高(high),并按此顺序排列。可选转换方式包括:• 使用默认设置:应用全局默认处理方式。
-
保留分类:保持属性不变。
-
首值作为基值:将包含 N 个值的分类变量转换为 N-1 个数值型变量,每个变量表示原始值中除基
-