机器学习基础:房价预测与模型评估
1. 房价预测:回归示例
在预测房价的回归问题中,我们使用均方误差(MSE)作为损失函数。MSE 是预测值与目标值之间差值的平方,是回归问题中广泛使用的损失函数。在训练过程中,我们还会监控一个新的指标:平均绝对误差(MAE),它是预测值与目标值之间差值的绝对值。例如,在这个问题中 MAE 为 0.5 意味着预测值平均偏离目标值 500 美元。
2. 使用 K 折交叉验证验证方法
当调整模型参数(如训练轮数)时,我们可以将数据分为训练集和验证集。但由于数据点较少,验证集可能会非常小,这会导致验证分数的方差较大,无法可靠地评估模型。在这种情况下,K 折交叉验证是最佳实践。
K 折交叉验证的步骤如下:
1. 将可用数据分成 K 个分区(通常 K = 4 或 5)。
2. 创建 K 个相同的模型。
3. 每个模型在 K - 1 个分区上进行训练,并在剩余的一个分区上进行评估。
4. 模型的验证分数是 K 个验证分数的平均值。
以下是 K 折交叉验证的代码示例:
import numpy as np
k = 4
num_val_samples = len(train_data) // k
num_epochs = 100
all_scores = []
for i in range(k):
print('processing fold #', i)
val_data = train_data[i * num_val_samples: (i + 1) * num_val_sam
超级会员免费看
订阅专栏 解锁全文
1127

被折叠的 条评论
为什么被折叠?



