机器学习
把小兔打哭
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习之特征工程
1、特征工程是什么 特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。 2、特征工程的意义 直接影响预测结果 3、数据的特征抽取 1、将文本、字符串等数据转换为数字的形式(特征值化) 2、对字典数据进行特征值化 sklearn.feature_extraction.DictVectorizer 1、DictVectorizer.fi...原创 2019-07-18 16:52:31 · 375 阅读 · 0 评论 -
机器学习之数据降维
数据降维:减少特征数量 一、特征选择 1、特征选择原因 冗余:部分特征相关度高,容易消耗计算性能 噪声:部分特征对预测结果由影响 2、特征选择是什么 特征选择就是单纯地从提取到地所有特征中选择部分特征作为训练集特征 主要方法: Filter(过滤式):VarianceThreshold(方差) Embedded(嵌入式):正则化、决策树 Wrapper(包裹式) sklearn.featur...原创 2019-07-18 19:49:06 · 852 阅读 · 0 评论 -
机器学习之03数据特征预处理
一、特征处理是什么 通过特定的统计方法(数学方法),将数据转换成算法要求的数据 1、数值型数据 标准缩放: (1)归一化 (2)标准化 (3)缺失值 2、类别型数据:one-hot编码 3、时间类型:时间的切分 4、预处理API:sklearn.preprocessing 二、归一化 特点:通过对原始数据进行变换把数据映射到[0,1]之间 公式:x’ = (x - min) / (max - m...原创 2019-07-19 11:28:34 · 306 阅读 · 0 评论
分享