推荐系统将用户和物品关联起来的3种方式:
1. 利用用户喜欢得物品,推荐和这批物品相似得的物品;
2. 利用和用户具有相似兴趣的用户群体,推荐这个群体喜欢的物品;
3. 用特征做桥梁关联用户和物品(用户有哪些特征,推荐具备这些特征的物品)
让用户给物品打标签,是王道:1. 节省标注员;2.通过用户爱打什么标签得知他喜欢或者关注哪些方面;
用户给物品打的标签,是分成好多种类的:1. 物品是什么;2.物品的种类;3.用户的观点;
Hulu给视频的标签做了分类;
豆瓣在个性化推荐结果里,给推荐结果们按照标签进行了聚类,每一类选择几个推荐出来;从而增加了推荐的多样性;
1. 我们用的:用户标签向量 点乘 物品标签向量,得到用户和物品的相似度;
2. 直接点乘会倾向只推热门标签的物品;可以对用户向量和物品向量进行TF-IDF处理,即分别把”标签在多少用户的向量里出现过“和”该物品被多少用户打过标签“作为IDF; 从而适当惩罚热门标签和热门物品;
3. 新用户来了以后,用户标签向量很稀疏,可以利用同义词近义词扩展标签向量;标签-标签相似度,可以用标签在所有物品上的分数构成向量,2标签的向量求cosine距离即可(标签-物品-标签,有点儿像CF);
4. 标签清理:最麻烦最恶心的脏活儿累活儿;a.去除词频很高的词;b.对同义词只保留一个; c.收集用户反馈;
5. 基于图的推荐:3组节点:用户,标签,物品;边上赋予权重;可以用PersonalRank迭代得到用户-->物品的分数;
6. 基于标签的推荐解释:豆瓣,上边是从用户历史行为中得到的标签云(字体越大表示权重越大),用户可以选择其中几个标签,则下面的推荐列表会产生相应变化;
7. 提供给用户一些标签让用户去打的好处:节省用户打字的费劲;避免同义词和错别字的干扰;提供哪些标签呢?a.该物品常被打的标签(最重要!); b. 该用户常打的标签(辅助a);a与b结合效果最好!
本文探讨了推荐系统中利用用户和物品标签提高推荐准确性和多样性的方法,包括用户标签向量与物品标签向量的点乘计算相似度、TF-IDF处理、标签扩展与清理策略、基于图的推荐算法及标签解释机制。

被折叠的 条评论
为什么被折叠?



