双SVD降维的混合推荐方法解析
1. 引言
推荐系统通过预测用户对未评价项目的评分来推荐项目。评分预测主要有两种方法:
- 基于内容的过滤(CBF):根据项目内容,如单词出现频率来预测评分。
- 协同过滤(CF):依据其他用户对项目的评分来预测。
奇异值分解(SVD)是用于改进预测的方法之一,它有提高准确性和降低内存需求的优点,但在某些情况下,内存需求可能不会减少。本文提出了一种新的推荐方法,旨在减少计算所需的内存。该方法结合了两个降维步骤:首先基于用户评分模式应用基于CF的SVD减少文档数量;然后基于这些减少文档的词频模式应用基于CBF的SVD减少术语数量。
2. 现有方法
- 潜在语义索引(LSI)
- LSI是基于向量空间模型的信息检索技术。文档的术语权重(如词频)表示文档向量,所有检索到的文档构成文档 - 术语矩阵F(d × t矩阵,d为文档数,t为唯一术语数)。
- LSI使用SVD减少文档 - 术语矩阵:$F = D \times R \times T^t$ ,其中D是d × r正交矩阵,T是d × r正交矩阵,R是r × r对角矩阵。SVD将文档维度从t减少到r。
- 提取k(<r)个术语向量构建矩阵Dk,可将术语维度减少到k,减少术语有助于同义词归纳,使搜索关键词能检索包含相应同义词的文档。
- 基于SVD的内容过滤(SVD - CBF)
- SVD - CBF是在信息检索中应用L
超级会员免费看
订阅专栏 解锁全文
33

被折叠的 条评论
为什么被折叠?



