过拟合和欠拟合

概念

优化:代表通过调整模型来训练数据上表现最好。
泛化:代表模型在未见过的数据上的表现。

防止过拟合

1.弄更多的训练数据
2.调节模型储存的信息的质量,用来解决过拟合的方法叫做正则化。

减少网络大小

最简单的预防过拟合方法就是减少模型的大小。
模型中可学习参数的数量被称为模型的“容量”。
没有什么有魔力的公式能够决定层所需的正确数量,以及每一层的正确大小。你必须评估一系列不同的结构(在你的验证集上而不是测试集上)来找出你的数据的正确模型大小。一般的找到合适大小的流程是从一些相关的比较少的层数和参数开始,然后开始提高层的大小并增加新的层知道你看到验证集的损失开始下降为止。

增加正则化权重

  • L1正则化,花费取决于权重系数的绝对值
  • L2正则化,花费取决于权重系数的平方,也称权重衰减。
    在keras里面,权重正则化通过权重正则化实例加进来作为关键词参数。让我们在电影评论分类网络中加入L2去那种正则化。
from keras import regularizers
model = models.Sequential()
model.add(layers.Dense(16, kernel_regularizer=regularizers.l2(0.001),
 activation='relu', input_shape=(10000,)))
model.add(layers.Dense(16, kernel_regularizer=regularizers.l2(0.001),
 activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

其中l2(0.001)意味着图层的权重矩阵将会乘以0.001加入到最终网络的损失中。注意乘法只在训练的时候加进去,也就是说网络的损失在训练的时候要比测试的时候高很多。
作为l2的替代,你可以看到如下的keras权重正则化:

from keras import regularizers
# L1 regularization
regularizers.l1(0.001)
# L1 and L2 regularization at the same time
regularizers.l1_l2(l1=0.001, l2=0.001)

添加drop out

dropout应用到“层”里面,由随机"dropping out"层在训练中学习到的要输出的特征。在测试的时候,没有单元被dropped out,层的输出值会按照dropout rate来缩放,以平衡在测试时和训练的时比有更多的单元。
在keras里面,能使用dropout层来直接引入dropout。

model = models.Sequential()
model.add(layers.Dense(16, activation='relu', input_shape=(10000,)))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(16, activation='relu'))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(1, activation='sigmoid'))

总结

  • 更多的训练数据
  • 减少网络的容量
  • 增加权重正则化
  • 增加dropout
### 如何检测区分机器学习中的过拟合拟合 在机器学习领域,过拟合拟合是常见的两类问题。为了有效识别这些问题,可以采用多种方法来评估模型性能。 #### 学习曲线分析 一种常用的方法是通过绘制 **学习曲线** 来观察模型的表现。学习曲线展示了随着训练数据量的变化,模型在训练集验证集上的误差变化趋势[^1]。 - 如果模型在训练集上表现良好但在验证集上表现较差,则可能表明存在过拟合现象。 - 若模型在训练集验证集上的误差均较高,则可能是拟合的结果。 #### 偏差与方差分解 另一种视角是从偏差方差的角度出发。当模型表现出较大的偏差时,通常意味着它未能充分捕捉数据中的模式,这通常是拟合的标志;而较高的方差则表示模型对噪声过于敏感,这是典型的过拟合特征[^2]。 #### 数据分布比较 还可以通过对训练数据测试数据之间的分布差异进行对比来辅助判断。如果模型仅能很好地适应训练数据而在新数据上泛化能力不足,则说明可能存在过拟合问题[^3]。 以下是基于上述理论的一个简单代码实现用于生成并可视化学习曲线: ```python import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import learning_curve from sklearn.linear_model import LogisticRegression def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None, n_jobs=-1, train_sizes=np.linspace(.1, 1.0, 5)): plt.figure() plt.title(title) if ylim is not None: plt.ylim(*ylim) plt.xlabel("Training examples") plt.ylabel("Score") train_sizes, train_scores, test_scores = learning_curve( estimator, X, y, cv=cv, n_jobs=n_jobs, train_sizes=train_sizes) train_scores_mean = np.mean(train_scores, axis=1) test_scores_mean = np.mean(test_scores, axis=1) plt.grid() plt.plot(train_sizes, train_scores_mean, 'o-', color="r", label="Training score") plt.plot(train_sizes, test_scores_mean, 'o-', color="g", label="Cross-validation score") plt.legend(loc="best") return plt # Example usage with logistic regression model X, y = ... # Your dataset here plot_learning_curve(LogisticRegression(), "Learning Curve", X, y, cv=5).show() ``` 此脚本可以帮助直观地看到不同大小样本下模型的学习效果,从而帮助诊断是否存在过拟合拟合状况。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值