
初级算法梳理
爱吃文字的鲸鱼
这个作者很懒,什么都没留下…
展开
-
线性回归算法梳理
机器学习的一些概念 有监督:数据做过标记无监督:对原始数据进行处理,未做标记泛化能力:由训练数据建立的模型对同类问题的解决能力过拟合:模型过于复杂导致解决问题能力差欠拟合:模型过于简单导致拟合数据的能力差(方差和偏差以及各自解决办法)交叉验证:当数据比较少时,将数据分成n份,取n-1份做训练集,1份做验证集,改变验证集再进行训练,优化参数。对于方差、偏差、...原创 2019-03-01 15:20:52 · 265 阅读 · 0 评论 -
task3-决策树算法梳理
1. 信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 参考:https://zhuanlan.zhihu.com/p/35423404信息熵:通常用来描述整个随机分布所带来的信息量平均值,更具统计特性。信息熵也叫香农熵,在机器学习中,由于熵的计算是依据样本数据而来,故也叫经验熵。联合熵:两个随机变量X,Y的联合分布,可以形成联合熵Joint Entropy,用H(X,Y)表示。...转载 2019-03-05 16:37:06 · 236 阅读 · 0 评论 -
task2-逻辑回归算法梳理
1、逻辑回归与线性回归的联系与区别 逻辑回归和线性回归的变量不同,逻辑回归用于分类,线性回归用于预测2、 逻辑回归的原理建立模型->代价函数->优化->最优模型参数,测试集测试。3、逻辑回归损失函数推导及优化 参考:https://blog.youkuaiyun.com/ligang_csdn/article/details/538387434、 正则化与模型评估指标 ...转载 2019-03-03 15:16:27 · 149 阅读 · 0 评论