DSSM模型可以生成item的语义向量,再推荐系统中经常再召回环节使用,很经典的一个召回模型。它的关键点:
1.用 word hashing将输入的高维向量先变换到了比较低维的向量,这种方式对于业界来说是很不错的,因为通常我们的词库或者物品集是很大的,如果我们用很高维的向量直接输入 那模型训练的压力就太大了。word hashing就是一层的线性映射
2. 使用的有监督学习方法。以推荐为例,输入特征有物品特征 用户特征 然后标签为用户下一刻点击的物品,负样本从非正样本的item随机抽取。得到用户和物品的语义向量,计算语义向量的余弦相似度,余弦相似度进行映射作为预测结果,物品是否是下一刻点击物品用0和1标识真实结果,然后损失函数二分类损失函数
3.我们通常会取模型中的语义向量出来作为物品的语义向量,用于召回任务。
论文中的模型图

推荐系统中的召回结构

这块的理解就到这里了,自己实际项目中没有用到,就不再细究DSSM模型如今其他的变种了。
参考博客:
DSSM模型通过wordhashing降低高维输入向量的维度,采用有监督学习方法训练,以用户和物品的语义向量计算余弦相似度进行召回。该模型常用于生成物品的语义向量,在实际项目中可能作为召回任务的一部分。
https://zhuanlan.zhihu.com/p/501175875
1790

被折叠的 条评论
为什么被折叠?



