推荐系统中的冷启动问题及相似度计算
1. 利用类别解决冷启动问题
在解决推荐系统中的冷启动问题时,有时需要换个角度思考。当面对只有少数人购买和评价的一系列产品时,很难直接推断出推荐内容。此时,可以借助产品的元数据来寻找相似产品。
以 Redbubble 网站为例,艺术家创作的艺术作品往往符合特定用户群体的口味。为了获取更丰富的数据,可以按艺术家对所有艺术作品进行分组,将其视为一个整体。例如,萨尔瓦多·达利创作了许多艺术作品,假设他并非举世闻名,但有数千人购买他的画作。可以将购买了他某一幅画作的用户视为也可能购买艺术家 X 作品的人群,然后推荐艺术家 X 最受欢迎的作品。
这种方法可以抽象为以下步骤:
1. 找到物品的类别或抽象概念 :例如,对于音乐可以将歌曲抽象为艺术家,对于新闻可以将其抽象为主题或作者的文章。
2. 基于类别或抽象概念计算推荐 :根据找到的类别或抽象概念,计算推荐内容。
3. 找到类别中最受欢迎的产品 :从计算出的推荐内容中,选择最受欢迎的产品进行推荐。
下面是这个过程的 mermaid 流程图:
graph TD;
A[找到物品的类别或抽象概念] --> B[基于类别或抽象概念计算推荐];
B --> C[找到类别中最受欢迎的产品];
需要注意的是,抽象或分类不能过于宽泛,否则类别之间的关联将失去价值。例如,“动作 => 喜剧”这样的关联虽然在数
超级会员免费看
订阅专栏 解锁全文
1522

被折叠的 条评论
为什么被折叠?



