14、简单分类问题中的模型构建与损失函数选择

wind

于 2025-07-22 16:46:08 发布

阅读量22

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch深度学习入门指南文章标签：逻辑回归特征标准化二元交叉熵损失

本文链接：https://blog.youkuaiyun.com/wind/article/details/151166418

PyTorch深度学习入门指南专栏收录该内容

58 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

简单分类问题中的模型构建与损失函数选择

1. 特征标准化

在处理数据时，我们可以使用 Scikit - Learn 的 StandardScaler 对特征进行标准化，代码如下：

from sklearn.preprocessing import StandardScaler

# 假设 X_train 和 X_val 已经定义
sc = StandardScaler()
sc.fit(X_train)

X_train = sc.transform(X_train)
X_val = sc.transform(X_val)

需要注意的是，只能使用训练集来拟合 StandardScaler ，然后使用其 transform() 方法对所有数据集（训练集、验证集和测试集）进行预处理。否则，会将验证集和/或测试集的信息泄露给模型。

2. 数据准备

通常，数据准备步骤会将 Numpy 数组转换为 PyTorch 张量，为它们构建 TensorDatasets ，并创建相应的数据加载器，代码如下：

import torch
from torch.utils.data import TensorDataset, DataLoader

torch.manual_seed(13)

# 从 Numpy 数组构建张量
x_train_tensor = torch.as_ten

会员秒杀 ¥9.9 重磅福利

超级会员免费看