Orange3数据预处理(连续化组件)

连续化(Continuize)
将离散变量(属性)转换为数值型(“连续”)变量。 连续化组件接受一个数据集作为输入,并输出同一个数据集,其中一些或所有分类变量被替换为连续变量,数值变量被缩放。
选项"Use preset"的作用是使用预设的连续化参数来处理分类变量
选择一个分类属性以定义其特定的处理方式,或者点击上面的“默认”选项来为所有没有特定设置的分类属性设置默认处理。 
Most frequent value as base:选项最常见的为基,会将最常见的离散值视为 0,其他视为1,具有2个以上值的离散属性的话,最常使用的离散属性将被视为基
One-hot encoding:选项每一个值一个特征,为每个值创建列,在实例中包含该值的地方放置1,不包含该值的地方放置0
Treat as ordinal:选项按有序数据处理,将离散值视为数字,也可以使用域编辑组件处理,分类按照数据中出现的次序分配一个数字
Treat as normalized ordinal: 将分类变量视为标准化序数:与上述相同,只是将值标准化到0-1的范围内。在我们的示例中,新变量的值将是0、0.5和1。

归一化:
Standardize( 标准化):减去平均值,然后除以标准差(不适用于稀疏数据)
Center(中心化):减去平均值(不适用于稀疏数据)
Scale( 缩放):除以标准差
Normalize to interval [-1, 1](标准化到[-1, 1]区间):线性缩放值到[-1, 1]区间

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值