误差 偏差 方差



### 泛化误差偏差-方差关系的理论推导 在机器学习领域,泛化误差通常可以通过偏差(Bias)、方差(Variance)和不可约误差(Irreducible Error)来分解。这种分解提供了一种分析模型性能的方法,并揭示了偏差方差之间的权衡。 #### 数学表达形式 假设目标函数 \(f(x)\) 是真实的映射关系,\(y\) 表示观测值,\(\epsilon\) 表示随机噪声项,满足均值为零且独立于输入变量 \(x\) 的条件。因此有: \[ y = f(x) + \epsilon \] 对于回归问题中的平方损失函数(Mean Squared Error, MSE),可以将泛化误差分解为三个部分[^3]: 1. **偏差**:衡量模型预测值与其期望值之间的差异。 2. **方差**:反映模型对训练数据敏感的程度,即模型预测值的变化范围。 3. **不可约误差**:由于噪声的存在而导致的固有不确定性。 具体来说,设模型估计为 \(\hat{f}(x)\),则任意样本点 \(x_0\) 处的预期预测误差可写成如下形式: \[ E[(y - \hat{f}(x))^2] = Bias^2[\hat{f}(x)] + Var[\hat{f}(x)] + Var[\epsilon] \] 其中, - 偏差定义为: \[ Bias[\hat{f}(x)] = E[\hat{f}(x)] - f(x) \] - 方差定义为: \[ Var[\hat{f}(x)] = E[(\hat{f}(x) - E[\hat{f}(x)])^2] \] - 不可约误差为噪声本身的方差: \[ Var[\epsilon] \] 通过上述公式可以看出,总误差是由三部分组成:偏差方差以及无法消除的数据噪声。 #### 偏差-方差权衡 当调整模型复杂度时,会出现一种矛盾现象——增加模型复杂度会降低偏差但提升方差;反之亦然。这是因为简单模型难以捕捉复杂的模式从而造成较大的偏差,而过于复杂的模型容易受到训练集中微小波动的影响进而增大方差[^2]。 为了达到最佳效果,在实际应用过程中需要找到合适的平衡点使得整体误差最小化。这一过程被称为“偏差-方差权衡”或者“Trade-off”。理想情况下,应该选取既不过拟合也不欠拟合的状态作为最终解决方案。 ```python import numpy as np from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error from sklearn.linear_model import LinearRegression from sklearn.preprocessing import PolynomialFeatures def bias_variance_tradeoff(X, y): X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2) degrees = range(1, 10) training_errors = [] validation_errors = [] for degree in degrees: poly_features = PolynomialFeatures(degree=degree, include_bias=False) X_poly_train = poly_features.fit_transform(X_train.reshape(-1, 1)) model = LinearRegression() model.fit(X_poly_train, y_train) X_poly_val = poly_features.transform(X_val.reshape(-1, 1)) pred_train = model.predict(X_poly_train) pred_val = model.predict(X_poly_val) training_errors.append(mean_squared_error(y_train, pred_train)) validation_errors.append(mean_squared_error(y_val, pred_val)) return degrees, training_errors, validation_errors ``` 以上代码展示了如何利用多项式特征工程探索不同阶数下的训练集和验证集上的均方误差变化趋势,以此观察是否存在明显的偏差-方差权衡情况。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值