
机器学习
文章平均质量分 97
克里斯大炮
这个作者很懒,什么都没留下…
展开
-
(机器学习)sklearn降维算法PCA(用几个小案例详解PCA降维)
本文主要参考菜菜的机器学习课程及其课件本篇博文基本不涉及PCA的任何数学过程,仅讲解在sklearn中如何调用相关类实现PCA降维目录1.维度和降维的定义1.1维度的定义1.2降维的含义1.3降维的步骤2.PCA和SVDclass sklearn.decomposition.PCA2.1重要参数n_components2.1.1案例:高维数据的可视化2.1.2 最大似然估计自选超参数n_components2.1.3 按信息量占比选超参数n_components2.2重要参数svd_solver 与 r原创 2020-12-04 21:43:11 · 15163 阅读 · 1 评论 -
(机器学习)随机森林填补缺失值的思路和代码逐行详解
随机森林填补缺失值1.使用0和均值来填补缺失值2.用随机森林填补缺失值的思路3.使用随机森林填补缺失值代码逐行详解3.1导包,准备数据,以及创造缺失的数据集3.2数据集中缺失值从少到多进行排序3.3构建新特征矩阵和新标签3.4在新特征矩阵中,对含有缺失值的列进行0的填补3.5找出训练集和测试集3.6用随机森林回归来填补缺失值3.7将填补好的特征填入到原始的特征矩阵中3.8完整代码4.随机森林填补缺失值的效果5.完整代码我们从现实中收集的数据,几乎不可能是完美无缺的,往往都会有一些缺失值。而随机森林的回归,原创 2020-11-13 15:10:11 · 20579 阅读 · 15 评论 -
(机器学习)sklearn随机森林和RandomForestClassifier、RandomForestRegressor类
1.集成算法概述随机森林一种集成算法。集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果。集成算法会考虑多个评估器的建模结果,汇总之后得到一个综合的结果,以此来获取比单个模型更好的回归或者分类结果。多个模型集成成为的模型叫做集成评估器(ensemble estimator),组成集成评估器的每个模型都叫做基评估器(base estimator),对于随机森林来说,它的基评估器就是决策树,一大堆原创 2020-11-13 13:56:35 · 3352 阅读 · 0 评论