极大似然估计
概率最大的角度考虑问题就是极大似然估计了,基本思想是:maxP(yi|xi,θ),这里可以理解为:如果假设 y 服从某一分布,那么就求使得已知样本
如果考虑到建模误差,那么yi=θTxi+εi,εi∈R,通常情况下,如果假设εi服从N(0,σ2i),σ2i=σ2,i=1,2,⋯m,那么可以得到:yi服从N(θTxi,σ2),那么 y 的概率密度函数为:
问题就转换成求概率最大:
θ^=argmaxθP(yi|xi,θ)
利用极大似然估计来求解,定义似然函数为:
L(θ,σ2)=∏i=1mρ(yi∣∣xi,θ,σ2)
下面是求解,取对数:
lnL(θ,σ2)=−n2ln(2π)−n2lnσ2−12σ2∑i=1m(yi−θTxi)2
令
∂lnL(θ,σ2)∂θ=−1σ2∂∂θ12∑i=1m(yi−θTxi)2=0
∂lnL(θ,σ2)∂σ2=−n2σ2+12(σ2)2∑i=1m(yi−θTxi)2=0
可以看出中上面的式子其实就是上一节中的求解式子。可以看出极大似然估计的妙处了,一个是误差值最小,一个概率值最大。最小二乘数学建模等价于高斯噪声最大似然估计统计建模.