一、提出动机
这个模型依然是研究如何更好地从用户的历史行为中捕捉到用户的动态兴趣演化规律。
1.1、序列本身的特点:
其实用户点击序列有他自己本身的特点:用户过去可能有很多历史点击行为,按照用户的点击时间排好序,比如[item3,item45,item69,item21,...],大部分情况下用户的兴趣是非常广泛且多变的,那么这一大串序列的商品中,往往出现的一个规律就是再比较短的时间间隔内的商品往往会很相似,时间间隔长了之后,商品之间就会出现很大的差别,这个是很容易理解的,一个用户再半个小时之内的浏览点击的几个商品的相似度和一个用户上午点击和晚上点击的商品的相似度很可能是不一样的。
1.2、DIEN及之前模型的缺点
但DIEN就是只关注了如何去改进网络,而忽略了用户历史行为序列本身的这种特点,直接把一大串行为序列放入GRU让它自己去学,如果一大串序列一块让GRU学习的话,往往用户的行为快速改变和突然终止的序列会有很多噪声点,不利于模型的学习。
1.3、DSIN简介
所以,DSIN就是从序列本身的特点出发,把一个用户的行为序列分成了多个会话,所谓会话,其实就是按照时间间隔把序列分段,每一段的商品列表就是一个会话,那这时候,会话里面每个商品之间的相似度就比较大了,而会话与会话之间商品相似度就可能比较小。