一、前言
冷启动是推荐系统中的一个著名问题,给新用户展示哪些item决定了用户的第一感和体验; 给新用户推荐的item,如果用户不感兴趣,很可能再也不来了,所以我们需要保证item要足够热门,要保证足够的多样性,同时尽量保证可区分
推荐系统冷启动一般分为物品冷启动、用户冷启动和系统冷启动三大类。
二、用户冷启动
我们希望获取的信息(如年龄,性别,地域、学历、职业等)来做推荐,但是涉及安全隐私的问题,用户也越来越不愿意填写自己的信息了,所以还得靠我们自己来分析,逐步给用户画像。
1、用户注册信息:账号、推荐人(好友喜欢的标的物推荐)、推荐来源、手机号、ip地址、地理位置、移动设备型号(比如:苹果手机的用户,一般对苹果相关产品情有独钟)
2、引导用户填写感兴趣点:很多APP用户第一次访问,会引导选择兴趣点,有了这些兴趣点就可以 推荐用户喜欢的内容了。
3、采用兴趣迁移,如果用户是内部系统导流而来,可以用做兴趣迁移。
如果是社交关系APP, 用户在注册时要求导入社交关系等,这时可以将好友喜欢的标的物推荐给 你。利用社交信息来做冷启动,特别是在有社交属性的产品中,这是很常见的一种方法。社交推荐最大的好处是用户基本不会反感推荐的标的物(可以适当加一些推荐解释, 比如你的朋友XXX也喜欢),所谓人以类聚,你的好友喜欢的东西你也可能会喜欢。
4、新品推荐:人类喜新厌旧的特点,对于新品有天然的爱好兴趣
5、热门商品推荐:基于二八定律,20%的头部内容占到80%的流量,所以基于热门推荐往往效果还不错。
6、特价活动商品:对于物美价廉的商品,还是很有诱惑力的。
7、新人优惠专栏:特别拎出来说明,因为很多平台都会设置新人专栏,优惠力度很大。
8、.基于内容做推荐:当用户只有很少的行为记录时,也可以基于商品的内容的 topic model挖掘出item的主题分布 相似性进行推荐
9、采用快速试探策略:给用户提供多样化的选择,把每个栏目的商品选择一部分出来,总有一个是用户感兴趣的。
三、物品冷启动
对于新上线的标的物,可行的解决方案与策略有:
1、新品预售
2、新品专栏
3、利用协同过滤算法中的i2i 算法:基于物品 属性相似性,将新品推荐给消费过类似物品的用户。
4、利用协同过滤算法中的u2i 算法:将新品推荐给消费过此品的用户 相似的用户。
5、采用快速试探策略:将新品作为多路召回的一项,提供给用户,总有一个用户是感兴趣。而且大家都对新品感兴趣。
6、当然新品还有很多营销的方式,只不过不属于推荐算法的范畴,在此不做讨论。
四、系统冷启动
推荐算法依赖大量的历史数据,但是很无奈,系统冷启动,几乎没有可利用的数据,巧妇难为无米之炊啊,所以系统冷启动,只能以实时推荐算法为主。另外系统布局就显得很关键了,必须让用户快捷明了的找到商品。比如设置 新品、热门商品、排行榜、 最近热搜 、猜你喜欢,用户历史足迹等 栏目
五、实时推荐算法
1. 基于内容的推荐
基于内容的相似性(如类目、品牌、关键词,主题词等) topic model进行个性化推荐。
2. 协同过滤
协同过滤分为基于用户的协同过滤(User CF)和基于物品的协同过滤(Item CF)。尽管它在处理用户冷启动和物品冷启动方面存在局限性,但仍然是有效,详情参考上文。
3. 元学习和上下文信息
元学习(Meta-Learning)是一种有效的策略,通过预训练模型来适应新的任务或用户。这种方法可以在短时间内快速适应新用户或新物品的需求。同时,利用上下文信息(如时间、地理位置等)也能显著改善冷启动问题。
4. 随机游走和异质图模型
随机游走算法通过模拟用户的行为路径来探索潜在的兴趣点,而异质图则通过构建复杂的网络结构来捕捉不同实体间的关联关系。这些方法有助于在没有足够交互数据的情况下进行有效的推荐。
六、实践中的应用
在实际应用中,解决冷启动问题不仅依赖于算法层面的努力,还需要结合产品策略和用户调研等多种手段。例如,在新用户加入时填写问卷收集基本信息,在上传内容时勾选合适的标签等。
总之,推荐系统中的冷启动问题是一个复杂且多样的领域,需要综合运用多种技术和策略才能有效应对。