- 博客(4)
- 收藏
- 关注
原创 决策树算法梳理
1. 信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 2.决策树的不同分类算法(ID3算法、C4.5、CART分类树)的原理及应用场景 决策树通常包括三个步骤: 特征选择,决策树生成和决策树剪枝 决策树的生成过程就是:使用满足划分准则的特征不断的将数据集划分为纯度更高,不确定性更小的子集的过程。 ID3:采用信息增益划分数据。计算使用所有特征划分数据集,得...
2019-03-05 21:21:25
392
原创 逻辑回归算法梳理
1、逻辑回归与线性回归的联系与区别 最大。然后用所得的拟合函数进行二分类。 2、 逻辑回归的原理 分类的本质:在空间中找到一个决策边界来完成分类的决策 逻辑回归:线性回归可以预测连续值,但是不能解决分类问题,我们需要根据预测的结果判定其属...
2019-03-03 20:10:54
703
原创 sklearn流图及解释
图片如下 简单解释: sk-learn的这张图是这么划分的: 样本集低于50条样本,请回家好好睡一觉; 分类: 小样本 优先使用Linear-SVC 其次考虑 naive bayes(文本)、KNN 最终是SVC和Ensemble Classifier 大样本 优先使用SGD Classifier(线性模型的一种) 其次考虑kernel appro...
2019-03-01 18:39:18
1003
原创 线性回归算法梳理
1.机器学习的一些概念 监督:有标签数据,通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出, 例如分类。 半监督:综合利用有类标的数据和没有类标的数据,来生成合适的分类函数。 无监督:无标签数据,直接对输入数据集进行建模,例如聚类。 泛化能力:指算法对新样本的适应能力, 学习的目的是学到隐含在数据背后的规律,对具有同一规律的学习集以外的数据,经过训练...
2019-03-01 16:55:01
475
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅