来源于自学《凸优化》和《矩阵分析与应用》笔记
- 正则化最小二乘
给定AϵRm×nAϵRm×n,bϵRmbϵRm,为函数F1和F2两个目标的优化问题,Ax中A为已知系数矩阵,x表示要求的系数参数,b表示真实值,label,或者y值Ax中A为已知系数矩阵,x表示要求的系数参数,b表示真实值,label,或者y值
F1(x)=||Ax−b||22=xTATAx−2bTAx+bTbF1(x)=||Ax−b||22=xTATAx−2bTAx+bTb
F2(x)=||x||22=xTxF2(x)=||x||22=xTx
也就是无约束的两准则问题,
minimizef0(x)=(F1(x),F2(x))minimizef0(x)=(F1(x),F2(x))
选择λ1>0,λ2>0λ1>0,λ2>0
则问题变为,
λTf0(x)=λ1F1(x)+λ2F2(x)λTf0(x)=λ1F1(x)+λ2F2(x)
=λT(λ1ATA+λ2I)x−2λ1bTAx+λ1bTb=λT(λ1ATA+λ2I)x−2λ1bTAx+λ1bTb
因为Ax=bAx=b,所以上式化为
xT(λATA+λ2I)x−λ1bTAxxT(λATA+λ2I)x−λ1bTAx
x=(λ1ATA+λ2I)−1λ1ATb=(ATA+μI)−1ATbx=(λ1ATA+λ2I)−1λ1ATb=(ATA+μI)−1ATb
其中 μ=λ2/λ1μ=λ2/λ1,
此时μμ理解为F2相对于F1的权值
2 条件数,condition number
实际上,我们平时见到的普通最小二乘函数是这样的,Ax=bAx=b也就是
minmize∑(Ax−b)minmize∑(Ax−b),采用平方/二次的形式,或者叫欧式距离,是\
minmize∑(Ax−b)2minmize∑(Ax−b)2
用矩阵表示也就是
minmize∑(Ax−b)(ATxT−bT)minmize∑(Ax−b)(ATxT−bT)
其中的假设是,自变量x不含误差,只有因变量b存在服从正态分布的误差,但是很多时候,我们违反了假设,自变量也有误差,所以需要把上式化为,
(A+σA)(x+σx)=b(A+σA)(x+σx)=b
上式推导出
σx=(A+σA)−1b−A−1bσx=(A+σA)−1b−A−1b
=[(A+σA)−1−A−1]b=[(A+σA)−1−A−1]b
=−A−1σA(x+σx)=−A−1σA(x+σx)
由此得,||σx||2≤||A−1||2||σA||2||x+σx||2||σx||2≤||A−1||2||σA||2||x+σx||2
||σx||2||x+σx||2=(||A||2||A||−12)||σA||2||A||2||σx||2||x+σx||2=(||A||2||A||2−1)||σA||2||A||2
, 向量X的相对误差与数值,cond(A)=||A||2⋅||A−1||2cond(A)=||A||2⋅||A−1||2
称cond(A)为矩阵A的条件数,有时也用k(A)表示cond(A)为矩阵A的条件数,有时也用k(A)表示
本文探讨了正则化最小二乘法的基本原理及其数学表达形式,详细介绍了如何通过引入正则项来解决过拟合问题,并讨论了条件数的概念及其实用意义。
2万+

被折叠的 条评论
为什么被折叠?



