
特征工程
bbdlinden
一直努力的大数据工程师
展开
-
特征工程系列(四)特征的构建
《特征工程入门与实践》 笔记 目录《特征工程入门与实践》 笔记特征构建1.检查数据集2.填充分类特征 特征构建 1.检查数据集 查看数据集各列的类型和等级,等级分类参见 特征工程系列(二)特征理解 2.填充分类特征 调用 isnull().sum()查看缺失值 sklearn的Imputer类确实有most_frequent方法用众数来处理分类数据。不采用这种方法,构建自定义转换器。 例如: da...原创 2019-11-12 17:29:23 · 867 阅读 · 0 评论 -
特征工程系列(三)特征增强:清洗数据
《特征工程入门与实践》 笔记 目录《特征工程入门与实践》 笔记第三章 特征增强1.识别缺失值 第三章 特征增强 1.识别缺失值原创 2019-11-12 17:28:25 · 1102 阅读 · 0 评论 -
特征工程系列(二)特征理解
特征工程入门与实践 笔记 第二章 特征理解 数据结构的有无 拿到新的数据集,第一要确认数据是结构化的还是非结构化的。原创 2019-11-08 16:05:56 · 766 阅读 · 0 评论 -
特征工程系列(一)特征工程简介
特征工程入门与实践 笔记 第一章 特征工程简介 特征工程理解 近年来数据工程师的职位出现,主要是设计数据流水线和架构,用于处理原始数据,将数据转化为数据科学家或者机器学习工程师可以用的形式。 调查显示,数据科学家最不喜欢准备数据。 清洗和组织数据就是特征工程。 特征工程是什么 特征工程包含: 转换数据的过程(例如将数据转化成表格的形式) 特征(对机器学习有意义的数据属性) 更好的表示潜在的业务问...原创 2019-11-07 22:34:25 · 571 阅读 · 0 评论