34、机器学习中的数据处理与模型训练

rust6ferris

于 2025-08-23 11:26:15 发布

阅读量32

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习设计模式精解文章标签：机器学习数据处理模型训练

本文链接：https://blog.youkuaiyun.com/rust6ferris/article/details/151033803

深度学习设计模式精解专栏收录该内容

42 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习中的数据处理与模型训练

1. 数据分布与模型训练

在模型训练中，数据分布的处理至关重要。我们可以通过对部分训练数据进行反转操作来增强模型的泛化能力。以下是具体的操作步骤：
1. 选择部分训练数据并反转 ：选取 10% 的训练数据（如 x_train_copy[0:6000] ），将其反转。通常，当我们想训练一个模型来过滤某些内容时，使用 10% 的训练数据分布就足够了。

import numpy as np
x_train_invert = np.invert(x_train_copy[0:6000])
x_train_invert = (x_train_invert / 255.0).astype(np.float32)
x_train_invert = x_train_invert.reshape(-1, 28, 28, 1)
y_train_invert = x_train[0:6000]

合并训练数据集 ：将原始训练数据和反转后的训练数据合并，形成一个包含 66,000 张图像的新训练集。

x_combine = np.append(x_train, x_train_invert, axis=0)
y_combine = np.append(y_train, y_train_invert, axis=0)

会员秒杀 ¥9.9 重磅福利

超级会员免费看