公式定义
为数据集添加新特征。
输入
• 数据:输入的数据集
输出
• 数据:包含新增特征的数据集
通过用户自定义的表达式,公式功能可以将现有列组合生成新列。新增的列可以是分类变量、数值型或文本型。
对于数值型变量,只需提供新列名称和表达式即可。
- 已构建的变量列表
- 添加或删除变量
- 新特征名称
- 用 Python 编写的表达式
- 选择特征
- 选择函数
- 生成报告
- 点击“发送”以提交更改
以下示例展示了如何构建一个分类变量:当“萼片长度”(sepal_length)小于 6 时值为“lower”,介于 6 到 7 之间时为“mid”,否则为“higher”。注意:变量名中的空格需替换为下划线(例如 sepal_length
)。
- 变量定义列表