- 博客(5)
- 收藏
- 关注
原创 西瓜书第四章决策树
一、基本流程。 决策树包含一个根节点、若干内部结点、若干叶结点,决策树是一个递归过程。 叶结点——决策结果 其他节点——属性测试 根节点——样本全集 二、划分选择 1.信息增益 信息熵:度量样本集合纯度的常用指标。 2.增益率 减少偏好可能带来的不利影响。 C4.5算法:先从候选划分属性中找出信息增益高于平均水平的属性,再从中选择增益率最高的。 3.基尼指数 CART决策树使用基尼指数划分属性 三、剪枝处理 解决过拟合问题。 预剪枝:在决策树生成过程中,对每个结点在划分前先进行
2022-05-27 00:26:52
166
2
原创 西瓜书第三章(线性模型)笔记
一、线性回归 模型 ,使得 均方误差最常用来度量回归任务,最小二乘法用来是均方误差最小化求解模型的。 使得 最小化的过程。 多元线性回归引入正则化项。 对数线性回归解决非线性函数回归映射。 二、对数几率回归 对数几率 y是正例的可能性,1-y是反例的可能性。利用极大似然估计法、梯...
2022-05-23 23:55:09
183
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人