
特征工程
一骑走烟尘
这个作者很懒,什么都没留下…
展开
-
特征工程sklearn基础实践、特征工程数据可视化
文章目录特征工程sklearn实践模型评估指标和特征贡献度可视化特征工程sklearn实践这里主要以iris数据集为例,展示了数据预处理方法、三大类特征选择方法、降维方法。数据预处理方法:z_score标准化;min_max标准化;数据单位向量化;数据二值化;数据转为one_hot编码形式;缺失值填充;特征多项式变换;特征使用自定义函数变换。三大类特征选择方法:(...原创 2019-04-06 12:16:19 · 1040 阅读 · 0 评论 -
特征工程实践:泰坦尼克号幸存者预测
文章目录泰坦尼克号幸存者预测泰坦尼克号幸存者预测数据集下载地址:https://www.kaggle.com/c/titanic/data 。本案例主要展示特征工程对数据集的处理方法,模型只选择了简单的lr模型,最后得分并不高。import pandas as pdimport numpy as np# Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使...原创 2019-04-05 18:08:21 · 1435 阅读 · 0 评论 -
特征工程介绍
文章目录特征工程介绍特征处理洗脏数据(异常数据)特征工程介绍特征工程是指从原始数据转换为特征向量的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或者接近最佳性能)。特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,并通常需要大量的时间。典型的特征工程包括数据清理、特征提取、特征选择等过程。特征处理洗脏数据(异常数据)...原创 2019-03-12 18:23:03 · 1020 阅读 · 0 评论 -
主成分分析(PCA)降维原理、特征值分解与SVD分解
文章目录PCA介绍方阵A求取特征值和特征向量方法(特征值分解)基于特征值分解协方差矩阵实现PCA算法SVD分解原理SVD分解求取矩阵特征值基于SVD分解协方差矩阵实现PCA算法PCA介绍主成分分析(PCA)的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA构建k维空间的具体过程:PCA从原始n维空间中顺序地找一组...原创 2019-03-09 19:38:11 · 7837 阅读 · 0 评论