Python机器学习及实践——进阶篇:模型实用技巧(模型正则化)
任何机器学习模型在训练集上的性能表现,都不能作为其对未知测试数据预测能力的评估。
1. 欠拟合与过拟合
所谓拟合,是指机器学习模型在训练的过程中,通过更新参数,使得模型不断契合可观测数据(训练集)的过程。
使用线性回归模型在披萨训练样本上进行拟合:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File : Fitting.py
@Author: Xinzhe.Pang
@Date : 2019/7/23 23:50
@Desc :
"""
# 输入训练样本的特征以及目标值,分别存储在变量X_train与y_train之中
X_train = [[6], [8], [10], [14], [18]]
y_train = [[7], [9], [13], [17.5], [18]]
# 导入LinearRegression
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(X_train, y_train)
import numpy as np
# 在x轴上从0至25均匀采样100个数据点
xx &