模式识别机器学习术语

观测样本x

回归函数y(x, w)=w0 + w1 *x + w2 * x^2 + ... wm * x^m

 

虽然是关于x的高次多项式, 但仍被称作线性回归。 因为对于已有样本来讲, x都是已知的, wi是未知的, 所求也是wi

 

使用E(w) = 1/2 * sigma((y(xn, w) - tn)^2) 作为误差函数。 tn为xn的理论回归值, y(xn, w)为xn在w下的回归值, 二者差值的平方和的一半作为误差函数

 

模型选择: 确定m的大小

 

记得有些材料中提到模型过于复杂, 虽然会使得和样本拟合的非常好, 但对于未知样本分类效果差, 称作过拟合。 多种模型都合适时, 采用越简单的模型越好

 

10个样本点, 当m取值为10时必定存在一个函数能完全拟合。 m为10时,也称作该多项式的自由度为10 ? 10 degrees of freedom ?

 

有些提倡是: 样本点的个数不应超过参数个数的5倍, 5到10倍之间。 即当有20个样本点时, M的取值大约在[2, 4]之间

 

避免过拟合的一种做法是, 在评估E(w)的过程中, 增加惩罚值w因素, 新的E(w)定义如下:

E'(w) = E(w) + c * |w|^2,  w为(w0, w1,,, wm)

 

 

概率:

sum       rule:  p(x) = sigma(p(x, yi)), 或者积分

product rule:  p(x, y) = p(y|x) * p(x)    p(x, y)称为联合概率,XY取值为xy时的概率。 p(y|x)称为联合概率, 当X为x时,Y取值为y的概率 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值