最近的想法是在推荐模型中考虑根据用户对推荐结果的后续选择,利用已训练的offline预训练模型参数来更新新的结果。简单记录一下中途保存参数和后续使用不同数据训练的方法。
简单模型和训练数据
先准备一个简单模型,简单两层linear出个分类结果。
class MyModel(nn.Module):
def __init__(self):
super().__init__()
self.linear = nn.Linear(64, 32)
self.linear1 = nn.Linear(32, 10)
self.relu = nn.ReLU()
def forward(self, x):
x = self.linear(x)
x = self.relu(x)
x = self.linear1(x)
return x
准备训练用数据,这里直接随机两份,同时给出配套的十个类的分类label结果。要注意的是crossEntropy
交叉熵只认long
以上的tensor,label记得转一下类型。
rand1 = torch.rand((100, 64)).to(torch