Asia Information Retrieval Symposium, 2019, pp. 66–78.
为了提高POI推荐方法的性能,应该解决两个主要挑战:
1.利用地理信息来捕捉用户的个人地理概况和地理位置的受欢迎程度。
2.将地理模型纳入矩阵分解方法
为了解决这些问题,本文提出了一种基于局部地理模型的POI推荐方法,该方法考虑了用户和地点的观点。为此,通过考虑用户的主要活动区域和该区域内每个位置的相关性,提出了有效的地理模型。然后,将所提出的局部地理模型融合到逻辑矩阵分解中以提高POI推荐的准确性
本文提出的新的POI推荐方法:
该方法从用户和地点的角度考虑地理背景,以提供有效的地理模型。
用户的高活动区域被视为所提出模型的用户视角。此外,为了模拟位置的观点,我们假设未访问的POI周围的检查次数越多,此POI的推荐相关性越低。
所提出的地理模型被融合为新的矩阵分解框架以提高建议的准确的。为此,将所提出的模型添加到逻辑矩阵分解方法中以提出新的基于地理的POI建议。
贡献点:
提出了一种新的地理模型,该模型同时考虑了用户和地点的观点通过将地理模型融合到逻辑矩阵分解方法中,
提出了一种新颖的POI推荐方法通过将地理影响建模为重要的上下文信息,
方法分析:
提出了基于局部地理的逻辑矩阵分解(LGLMF)
第一步:根据用户和地点的观点提出本地地理模型(LGM),
第二步:将LGM融合到逻辑矩阵分解(MF)方法中。融合矩阵分解模型用于预测用户的偏好。
本地地理模型:
定义用户集:U={u1,u2……um}
定义POI集:P={p1,p2……pn}
令C∈R^m*n是一个用户-POI签到频率矩阵,其中有m个用户和n个POI。矩阵中的每个值表示用户u到POI p的签到频率。
引出两个定义:
即X是用户u未来可能访问的POI的集合,X的数量是≤用户u曾经访问过的POI的数量的,且用户u未来可能去的POI不是该用户曾经访问过的POI中的。
是用户访问的POI p的邻居数量
表示用户 u 访问的 p 的数量和
此处定义POI的地理影响。当用户u访问过POI p时,用户会对该POI周围一定范围内的POI感兴趣。
该算法由三个内环组成,用于对地理信息进行建模。前两个内环对用户区域进行建模(2-5),第三个循环计算考虑到对邻近POI的访问,用户更喜欢邻里内的POI(6-10)。
为了找到用户的高活动位置(在现实世界中,可能是用户的居住区域)。为此,用户最常签到的POI被用来推断为他的高活动位置(1)
我们扫描未访问的POI列表,以查找属于该用户同一区域内的那些POI,即距离用户的高活动位置(用户视角)α公里以内(5)
基于每个用户的区域内的POI,我们考虑签入的邻近的POI的影响,这些POI距离未访问的POI(位置的角度)小于r米的(7-10)
最终得到一个用户-POI偏好矩阵,此矩阵结合了用户和POI的角度。
构建矩阵分解模型
在LBSN中不存在明确的反馈数据,因此登录数据可以被视为隐式反馈数据。
用户U对POI p的偏好定义为:
表示u在POI p的登录次数(用户u偏向与POI p)
作为用户u和POI的偏见
概率型P被定义为u对POI p的偏好,公式2
取对数更方便计算,最终的目标函数为:
最后,将所提出的LGM融合到矩阵分解方法中,用户访问POI p的概率计算公式:
P由公式2计算,M(u,p)由伪代码来计算。
通过使用所提出的概率函数,可以为每个用户提供POI建议列表。我们所提出的LGLMF模型通过融合所提出的LGM将上下文信息考虑到推荐过程中。
数据集:
每个登录包含一个用户,一个POI(经纬度)和登录时间戳。访问次数少于15次的POI和POI少于10人的用户已从gowalla删除。少于10个登录POIs和少于10个访客的POIs的用户已从FourSquare删除。
70%训练,20%测试,10%验证
不同模型参数对LGLMF性能的影响