数据预处理:
(1)缺失值的时候,填充缺失值fillna:离散:None,连续:均值,缺失值太多,去除该列
(2)连续值,离散化,有的模型需要离散值
(3)对定量特征二值化,核心在于设定一个阈值,大于阈值的赋值1,小于等于阈值的赋值为0,
(4)皮尔逊相关系数,去除高度相关的列
特征工程的相关操作,及其
最新推荐文章于 2024-03-01 18:27:53 发布
数据预处理:
(1)缺失值的时候,填充缺失值fillna:离散:None,连续:均值,缺失值太多,去除该列
(2)连续值,离散化,有的模型需要离散值
(3)对定量特征二值化,核心在于设定一个阈值,大于阈值的赋值1,小于等于阈值的赋值为0,
(4)皮尔逊相关系数,去除高度相关的列