公式
为您的数据集添加新特征。
输入
数据:输入数据集
输出
数据:带有额外特征的数据集
公式组件允许通过使用用户定义的表达式来计算新列。结果列可以是分类的、数值的或文本的。
对于数值变量,只需提供名称和表达式。
1.构建变量列表
2.添加或删除变量
3.新特征名称
4.Python表达式
5.选择一个特征
6.选择一个函数
7.生成报告
8.点击发送以传达更改
以下示例显示了如何构建一个分类变量:
如果“sepal length”(萼片长度)小于6,其值为“lower”,至少为6但小于7时为“mid”,否则为“higher”。
注意需要将空格替换为下划线(sepal_length)。
1.变量定义列表
2.添加或删除变量
3.新特征名称
4.Python表达式
5.如果勾选,该特征将被置于元属性中
6.在表达式中选择一个特征
7.在表达式中选择一个函数
8.可选的值列表,用于定义它们的顺序