机器学习中的数据处理与模型训练
1. 数据分布与模型训练
在模型训练中,数据分布的处理至关重要。我们可以通过对部分训练数据进行反转操作来增强模型的泛化能力。以下是具体的操作步骤:
1. 选择部分训练数据并反转 :选取 10% 的训练数据(如 x_train_copy[0:6000] ),将其反转。通常,当我们想训练一个模型来过滤某些内容时,使用 10% 的训练数据分布就足够了。
import numpy as np
x_train_invert = np.invert(x_train_copy[0:6000])
x_train_invert = (x_train_invert / 255.0).astype(np.float32)
x_train_invert = x_train_invert.reshape(-1, 28, 28, 1)
y_train_invert = x_train[0:6000]
- 合并训练数据集 :将原始训练数据和反转后的训练数据合并,形成一个包含 66,000 张图像的新训练集。
x_combine = np.append(x_train, x_train_invert, axis=0)
y_combine = np.append(y_train, y_train_invert, axis=0)
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



