美团2020年发表的《Multi-modal Knowledge Graphs for Recommender Systems》
https://zheng-kai.com/paper/cikm_2020_sun.pdf
1 背景
知识图通过引用各种有效的辅助数据用于推荐系统,有效的解决了推荐系统的冷启动和数据稀疏性问题。
但是一般的知识图没有考虑多模态信息的作用,比如商品的图片评论信息。多模态知识图(MKG)将视觉或文本信息引入知识图,将图像或文本视为实体或实体的属性,如下图。
基于知识图的表示学习在推荐中有着关键作用,通常用来学习实体信息的嵌入。多模态知识图中,通常有两种方法
-
基于特征的多模态图
将多模态信息作为实体的一个辅助特征,通过视觉表征模型对视觉信息进行提取,视觉表征可以从与知识图谱实体相关的图像中提取。在这些方法中,三元组的得分是根据知识图谱的结构以及实体的视觉表征来定义的,这意味着每个实体必须包含图像属性。这对知识图谱的数据源提出了相对的要求,因为它要求知识图谱中的每个实体都有多模态的信息。
然而,在真实场景中,一些实体并不包含多模态信息。所以这种方法不能被广泛使用。
-
基于实体的多模态图
将多模态信息视为结构化知识的关系三要素,而不是预先确定的辅助特征。然后使用基于CNN的