序列及多任务排序-优快云博客

本文链接：https://blog.youkuaiyun.com/2301_82174761/article/details/145817927

一.DIN

1.结构模型

Embedding layer

这个层的作用是把高维稀疏的输入转成低维稠密向量，每个离散特征下面都会对应着一个embedding词典，维度是D×KD×K，这里的DD表示的是隐向量的维度，而KK表示的是当前离散特征的唯一取值个数, 这里为了好理解，这里举个例子说明，就比如上面的weekday特征：

pooling layer and Concat layer

pooling层的作用是将用户的历史行为embedding这个最终变成一个定长的向量，因为每个用户历史购买的商品数是不一样的，也就是每个用户multi-hot中1的个数不一致，这样经过embedding层，得到的用户历史行为embedding的个数不一样多，也就是上面的embedding列表 $t_{i}$ 不一样长，那么这样的话，每个用户的历史行为特征拼起来就不一样长了。而后面如果加全连接网络的话，我们知道，他需要定长的特征输入。所以往往用一个pooling layer先把用户历史行为embedding变成固定长度(统一长度)，所以有了这个公式：

$e_{i} = pooling(e_{i1},e_{i2},...e_{ik})$

这里的 $e_{ij}$ 是用户历史行为的那些embedding。 $e_{i}$ 就变成了定长的向量，这里的i表示第i个历史特征组(是历史行为，比如历史的商品id，历史的商品类别id等)，这里的k表示对应历史特种组里面用户购买过的商品数量，也就是历史embedding的数量，看上面图里面的user behaviors系列，就是那个过程了。 Concat layer层的作用就是拼接了，就是把这所有的特征embedding向量，如果再有连续特征的话也算上，从特征维度拼接整合，作为MLP的输入。