机器学习中的模型评估与线性回归模型
1. 模型评估与K折交叉验证
在模型评估中,之前我们通常保留30%的数据用于验证,这种策略能防止在训练模型时提前查看测试数据,但没有充分利用所有可用数据进行训练和测试。而K折交叉验证可以解决这个问题,它能使用所有数据,同时避免数据泄漏。
1.1 K折交叉验证原理
K折交叉验证将数据分为K份,每次使用K - 1份进行训练,剩下1份进行测试,重复K次,每次排除不同的折进行测试,最终的性能指标基于K折的平均得分。
1.2 使用K折交叉验证评估模型
以下是使用K折交叉验证评估线性回归、随机森林回归和K近邻回归模型的步骤:
1. 导入必要的库 :
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.neighbors import KNeighborsRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.pipeline import make_pipeline
from sklearn.model_selection import cross_validate
from s
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



