利用用户标签数据进行推荐
- 推荐系统联系用户和物品的三种方式:
(1) 利用用户喜欢过的物品,给用户推荐与他喜欢过的物品相似的物品,也就是ICF算法;
(2) 利用与用户兴趣相似的其他用户,给用户推荐那些和他们兴趣爱好相似的其他用户喜欢的物品;
(3) 通过一些特征联系用户和物品,给用户推荐那些具有用户喜欢的特征的物品。这些特征可以是物品的属性集合,也可以表现为隐语义向量。 - 标签是一种重要的特征表现方式,标签是一种无层次化结构,用来描述信息的关键词,它可以用来描述物品的语义。标签一般分为两种:一种是让作者或者专家给物品打标签;另一种是让普通用户给物品打标签,也就是UGC(User Genarated Content,用户生成的内容)的标签应用。
- UGC标签系统的代表应用:
(1) Delicious
标签系统的鼻祖,它允许用户给互联网上的每个网页打标签,从而通过标签重新组织整个互联网。
(2) CiteULike
著名的论文书签网站,通过群体智能,让每个研究人员对自己了解的论文进行标记,借此帮助其他研究人员更好更快地发现自己感兴趣的论文。
(3) Last.fm
为了在不进行复杂音频分析的情况下获得音乐的内容信息,它引入了UGC标签系统。
(4) 豆瓣
中国本土评论和社交网站,个性化推荐领域的领军企业之一。
(5) H