参考资料:神经网络与深度学习
这里写自定义目录标题
集成学习(Ensemble Learning)
通过某种策略将多个模型集成起来,通过群体决策来提高决策准确率,对于 M 个不同的模型 f 1 ( x ) , ⋯ , f M ( x ) f_1(\boldsymbol{x}), \cdots, f_M(\boldsymbol{x}) f1(x),⋯,fM(x),每个模型的期望错误为:
R ( f m ) = E x [ ( f m ( x ) − h ( x ) ) 2 ] = E x [ ϵ m ( x ) 2 ] \mathcal{R}\left(f_m\right)=\mathbb{E}_{\boldsymbol{x}}\left[\left(f_m(\boldsymbol{x})-h(\boldsymbol{x})\right)^2\right]=\mathbb{E}_x\left[\epsilon_m(\boldsymbol{x})^2\right] R(fm)=Ex[(fm(x)−h(x))2]=Ex[ϵm(x)2],其中 h ( ⋅ ) h(\cdot) h(⋅)表征输入与输出间的真实关系, ϵ m ( x ) \epsilon_m(\boldsymbol{x}) ϵm(x)即为误差项。则全部模型等权重“聚合”的平均错误为:
R ‾ ( f ) = 1 M ∑ m = 1 M E x [ ϵ m ( x ) 2 ] \overline{\mathcal{R}}(f)=\frac{1}{M} \sum_{m=1}^M \mathbb{E}_{\boldsymbol{x}}\left[\epsilon_m(\boldsymbol{x})^2\right] R(f)=M1m=1∑MEx[ϵm(x)2]
基于等权重“聚合”(投票)的集成模型为:
F ( x ) = 1 M ∑ m = 1 M f m ( x ) F(\boldsymbol{x})=\frac{1}{M} \sum_{m=1}^M f_m(\boldsymbol{x}) F(x)=M1m=1∑Mfm(x)
对于 M M M 个不同的模型 f 1 ( x ) , ⋯ , f M ( x ) f_1(\boldsymbol{x}), \cdots, f_M(\boldsymbol{x}) f1(x),⋯,fM(x) ,其平均期望错误为 R ‾ ( f ) \overline{\mathcal{R}}(f) R(f) 。基于简单投票机制的集成模型 F ( x ) = 1 M ∑ m = 1 M f m ( x ) , F ( x ) F(\boldsymbol{x})=\frac{1}{M} \sum_{m=1}^M f_m(\boldsymbol{x}), F(\boldsymbol{x}) F(x)=M1∑m=1Mfm(x),F(x) 的期望错误在 1 M R ‾ ( f ) \frac{1}{M} \overline{\mathcal{R}}(f) M1R(f) 和 R ‾ ( f ) \overline{\mathcal{R}}(f) R(f) 之间.
证明:
R ( F ) = E x [ ( 1 M ∑ m = 1 M f m ( x ) − h ( x ) ) 2 ] = E x [ ( 1 M ∑ m = 1 M ϵ m ( x ) ) 2 ] = 1 M 2 E x [ ∑ m = 1 M ∑ n = 1 M ϵ m ( x ) ϵ n ( x ) ] = 1 M 2 ∑ m = 1 M ∑ n = 1 M E x [ ϵ m ( x ) ϵ n ( x ) ] , \begin{aligned} \mathcal{R}(F) & =\mathbb{E}_{\boldsymbol{x}}\left[\left(\frac{1}{M} \sum_{m=1}^M f_m(\boldsymbol{x})-h(\boldsymbol{x})\right)^2\right] \\ & =\mathbb{E}_{\boldsymbol{x}}\left[\left(\frac{1}{M} \sum_{m=1}^M \epsilon_m(\boldsymbol{x})\right)^2\right] \\ & =\frac{1}{M^2} \mathbb{E}_{\boldsymbol{x}}\left[\sum_{m=1}^M \sum_{n=1}^M \epsilon_m(\boldsymbol{x}) \epsilon_n(\boldsymbol{x})\right] \\ & =\frac{1}{M^2} \sum_{m=1}^M \sum_{n=1}^M \mathbb{E}_{\boldsymbol{x}}\left[\epsilon_m(\boldsymbol{x}) \epsilon_n(\boldsymbol{x})\right], \end{aligned} R(F)=Ex
(M1m=1∑Mfm(x)−h(x))2
=Ex
(M1m=1∑Mϵm(x))2
=M21Ex[m=1∑Mn=1∑Mϵm(

最低0.47元/天 解锁文章
352

被折叠的 条评论
为什么被折叠?



