注意Base Model 中 对于历史行为特征中的商品id、goodsid 、cat id 是Multi-hot编码,其他的上下文特征如年龄性别都是One-hot编码;
参考 2特征表示:;
注意力机制得分:
没做softmax 归一化的原因: 为了保留用户的兴趣强度。如果做归一化,当序列长度很长时,容易导致权重系数很小,从而各个历史行为的强度也不然容易区分而且最终的加权和容易很小,兴趣向量不明显,
参考: “
【深度学习推荐模型】DIN模型 —— 阿里巴巴推荐领域开创性论文,引入注意力机制的深度学习网络,导读-4DIN模型网络结构” 。
https://www.bilibili.com/video/BV1eV41147oi?p=4&vd_source=0e2d47c0c67fb509b32ba3bfc5b73819