监督学习与特征工程入门
1. 监督学习初步实践
1.1 数据分割
在监督学习中,我们通常需要将数据划分为训练集和测试集。一般来说,保留 10% - 30% 的数据用于测试是比较合适的。以下是使用 scikit-learn 进行数据分割的代码示例:
import sklearn.model_selection as modsel
from sklearn.datasets import load_boston
boston = load_boston()
X_train, X_test, y_train, y_test = modsel.train_test_split(
boston.data, boston.target, test_size=0.1,
random_state=42
)
1.2 线性回归模型训练与评估
在 scikit-learn 中,训练函数被称为 fit 。以下是使用线性回归模型进行训练的代码:
from sklearn.linear_model import LinearRegression
import sklearn.metrics as metrics
linreg = LinearRegression()
linreg.fit(X_train, y_train)
我们可以通过计算均方误差(MSE
超级会员免费看
订阅专栏 解锁全文
1388

被折叠的 条评论
为什么被折叠?



