简单分类问题中的模型构建与损失函数选择
1. 特征标准化
在处理数据时,我们可以使用 Scikit - Learn 的 StandardScaler 对特征进行标准化,代码如下:
from sklearn.preprocessing import StandardScaler
# 假设 X_train 和 X_val 已经定义
sc = StandardScaler()
sc.fit(X_train)
X_train = sc.transform(X_train)
X_val = sc.transform(X_val)
需要注意的是,只能使用训练集来拟合 StandardScaler ,然后使用其 transform() 方法对所有数据集(训练集、验证集和测试集)进行预处理。否则,会将验证集和/或测试集的信息泄露给模型。
2. 数据准备
通常,数据准备步骤会将 Numpy 数组转换为 PyTorch 张量,为它们构建 TensorDatasets ,并创建相应的数据加载器,代码如下:
import torch
from torch.utils.data import TensorDataset, DataLoader
torch.manual_seed(13)
# 从 Numpy 数组构建张量
x_train_tensor = torch.as_ten
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



