Machine Learning算法总结

机器学习分为有监督学习和无监督学习。

机器学习算法可分为:分类算法,回归算法,等

分类算法:输入离散或连续值向量,可输出单个离散值(该向量的分类)。

回归算法:输入离散或连续值向量,可输出连续值向量。

机器学习算法要素: 机器学习算法 = 算法表达 + 算法评估 + 算法优化

算法表达:为解决问题,将问题抽象为算法表达。通过算法学习找到问题解。问题域的特性通过特征工程选择,作为算法的输入。举例:

K-nearest neighbor
Support vector machines
Naive Bayes
Logistic regression
Decision trees
Neural networks
Bayesian networks

算法评估:即 损失函数(lost/cost function) 或  evaluation函数, 用于评估算法的好坏。举例:

Accuracy/Error rate
Precision and recall
Squared error
(Maximal) Likelihood
Posterior probability
Information gain
K-L divergence

Cost/Utility

Margin

算法优化:将损失函数值最小化,或将evaluation函数值最大化的算法调优技术。举例:

Greedy search
Beam search
Branch-and-bound
Gradient descent
Conjugate gradient
Quasi-Newton methods
Quadratic programming

要素的组合形成不同算法。如:Linear Regression + Squared error + SGD 。

算法的灵活性和可解释性存在trade-off。灵活性更大的算法可解释性相对更小。(灵活性表示degrees of freedom,可解释性表示可被人类理解程度)。举例如,灵活性: Linear Regression < Trees < Bagging/Boosting < SVM , 可解释性:  SVM < Bagging/Boosting < Trees < Linear Regression

随着算法灵活性增加,训练集的误差不断减少,测试/验证集的误差先减少,再增加。训练集的误差很小而验证集误差很大的现象称为过拟合(overfitting)。

以线性回归的Squared Error为例,Mean Squared Error:

MSE = \frac{1}{n} \cdot \sum_{i=1}^{n} (y_{i} - \widehat{f}(x_{i}))^2

MSE的期望值(Expected Value)可分解为Variance 和 Bias:

E(y_{0}-\widehat{f}(x_{0})) ^2= Var(\widehat{f}(x_{0})) + [Bias(\widehat{f}(x_{0}))]^2 + Var(\epsilon )

其中, Var(\widehat{f}(x_{0})) >= 0 , [Bias(\widehat{f}(x_{0}))]^2 >= 0, 可知MSE期望值不可能小于 Var(\epsilon )(称为irreducible error)。

Variance和Bias存在trade-off。 Variance是估计值的变化量,例如,引入不同训练集时导致的估计值变化。Bias是算法估计值中固有的偏差量。训练数据的目的是使Variance和Bias都达到最小。一般更灵活的算法具有更大的Variance和更小的Bias。选择的算法逐渐灵活时,Bias逐渐减少,Variance逐渐增加。这两个量的相对变化率决定测试/验证集MSE增加还是减少。算法灵活度增加初始,Bias减少速度大于Variance增加速度,使得MSE不断下降,到某种程度时,Bias减少速度变小,Variance增加速度增大,使得MSE转而上升( 过拟合 overfitting)。

参考:

[1] A Few Useful Things to Know About Machine Learning -- Pedro Domingos

[2] An Introduction to Statistical Learning -- Gareth James Daniela Witten Trevor Hastie Robert Tibshirani

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

liskol

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值