
机器学习
文章平均质量分 54
ZYTmiss
这个作者很懒,什么都没留下…
展开
-
线性回归Linear Regression
原文链接: https://zhuanlan.zhihu.com/p/147297924转载 2021-11-11 16:37:35 · 124 阅读 · 0 评论 -
从集成学习到模型的偏差和方差的理解
从集成学习到模型的偏差和方差的理解 https://blog.youkuaiyun.com/xmu_jupiter/article/details/47314927转载 2021-11-11 09:29:56 · 98 阅读 · 0 评论 -
L1正则化和L2正则化
L1正则化和L2正则化: https://zhuanlan.zhihu.com/p/35356992转载 2021-11-11 09:25:41 · 78 阅读 · 0 评论 -
经验风险最小化和结构风险最小化
在假设空间、损失函数以及训练数据集确定的情况下,经验风险函数式就可以确定。经验风险最小化的策略认为,经验风险最小的模型是最优的模型。根据这一策略,按照经验风险最小化求解最优模型就是求解最优化问题: 当样本容量足够大时,经验风险最小化能保证很好的学习效果,在现实中被广泛采用。比如,极大似然估计就是经验风险最小化的一个例子。当模型是条件概率分布,损失函数是对数函数时,经验风险最小化就等价于极大似然估计。但是,当样本转载 2021-11-11 09:12:28 · 893 阅读 · 0 评论 -
过拟合欠拟合及解决原因
总结一下: 欠拟合:泛化能力差,训练样本集准确率低,测试样本集准确率低。 过拟合:泛化能力差,训练样本集准确率高,测试样本集准确率低。 合适的拟合程度:泛化能力强,训练样本集准确率高,测试样本集准确率高 欠拟合原因: 1.训练样本数量少 2.模型复杂度过低 3.参数还未收敛就停止循环 欠拟合的解决办法: 1.增加样本数量 2.增加模型参数,提高模型复杂度 3.增加循环次数 4.查看是否是学习率过高导致模型无法收敛 过拟合定义:模型在训练集上的表现很好,但在测试集和新数据上的表现很差。 过拟合原因 1.模型.转载 2021-11-11 08:30:39 · 4935 阅读 · 0 评论 -
SVM支持向量机
SVM线性可分支持向量机一.线性可分二.间隔1.函数间隔2.几何间隔3.两者关系三.硬间隔最大化1.约束最优化问题2.线性可分支持向量机3.支持向量和间隔边界4.对偶算法线性支持向量机1.软间隔最大化4.信息增益算法5.信息增益存在的问题6.信息增益比三.决策树的剪枝1.防止过拟合:2.预剪枝:3.后剪枝:4.两者比较:*缺失值处理四.决策树优缺点优点缺点 一.原理 1.学习算法定义 启发式方法,递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程 2.树停止的条件 (1)当前节点包含的样本全属于同一类别,无需划分 (2)当前属性集为空,或所有样本原创 2021-11-10 12:37:36 · 1521 阅读 · 0 评论 -
朴素贝叶斯算法
朴素贝叶斯算法一.基本方法1.给定训练数据集2.学习先验概率分布3.学习条件概率分布4.进行条件独立性假设5.以后验概率最大的类输出二.参数估计--最大似然1.先验概率2.条件概率三.算法流程四.贝叶斯估计五.优缺点1.主要优点2.主要缺点 一.基本方法 1.给定训练数据集 2.学习先验概率分布 3.学习条件概率分布 4.进行条件独立性假设 条件独立性假设是说用于分类的特征在类确定的条件下都是条件独立的 5.以后验概率最大的类输出 二.参数估计–最大似然 学习意味着估计类的先验概率和条件概率 1.原创 2021-11-10 12:27:20 · 558 阅读 · 0 评论