电影推荐与石化供应链风险管理研究
一、电影推荐算法相关研究
1.1 知识图谱数据处理
知识图谱中的数据处理涵盖结构化数据、文本数据和图片数据。
- 结构化数据 :可看作由不同类型实体和关系构成的网络,实体间关系越多,相似度越高。
- 文本数据 :指电影描述的概述,利用 Doc2Vec 算法提取电影剧情概述的嵌入向量。因为电影描述越相似,用户对这些相似电影的兴趣可能越高。
- 图片数据 :即电影海报信息,使用重新设计的 CAE 算法提取电影海报的嵌入向量,并重建内部神经网络进行特征提取。若电影海报的风格和元素相似,电影间的相似度可能更高。
1.2 构建相似度矩阵
由于获取的都是嵌入向量,使用欧几里得距离分别计算相似度矩阵。对于两部电影 i 和 j,它们之间的距离 d(i, j) 计算公式如下:
[d(i, j) = d(j, i) = \sqrt{\sum_{k = 1}^{dim}(i_k - j_k)^2}]
1.3 加权排序推荐
- 首先使用 BPR 为用户推荐 TOP - B 电影,权重为 wBPR;推荐 TOP - S 电影,权重为 wstruct。
- 对于文本信息,选择 TOP - T 电影,权重为 wtext。
- 由于图像信息准确性相对较低,选择一部电影,权重为 wfigure。且满足 wBPR > wsturct > wtext > wfigure。
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



