14、学习原理:简约原则与正则化的深度剖析

学习原理:简约原则与正则化的深度剖析

1. 最小描述长度(MDL)原理概述

MDL 原理旨在从所有可能的假设中选择最优假设。假设用 $H$ 表示,其描述长度记为 $L(H)$,而 $L(\delta)$ 表示校正误差的描述长度,其中 $\delta = (\delta_1, \ldots, \delta_{\ell})$。MDL 原理规定,我们应选择使 $L(H_{\kappa}) + L(\delta)$ 最小的假设 $\hat{H}$,即:
$\hat{H} = \min_{H_{\kappa} \in H} [L(H_{\kappa}) + L(\delta)]$

在多项式数据拟合问题中,$L(\delta)$ 编码了给定数据 $y$ 与预测值 $\hat{y}$ 之间的误差。高阶多项式虽有助于减小 $L(\delta)$,甚至使其为零,但会增加 $L(H)$。因此,找到拟合优度与模型复杂度之间的平衡至关重要。

为应用 MDL 原理,需明确 $L(H)$ 和 $L(\delta)$ 的表达式。$L(\delta)$ 可在编码理论框架下得到良好解释,假设已知 $Pr(\epsilon = \delta)$,则存在最优校正码,其长度为:
$L(\delta) = -\log Pr(\epsilon = \delta)$
此式对应香农 - 范诺码。

2. MDL 与正则化的联系

2.1 多项式拟合问题

考虑单变量函数的多项式拟合,目标是基于训练集 $L = {(x_1, y_1), \ldots, (x_{\ell}, y_{\ell})}$ 预测函数:
$f(x) = b

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值