一、推荐技术简介:
论文链接:https://www.researchgate.net/publication/263377228_Hybrid_Recommender_Systems_Survey_and_Experiments
CF协同推荐:(用户之间的相关性)对现存的对象的评分或推荐进行汇总,根据用户的评分识别用户之间的共性,并根据用户间的比较生成新的推荐。协作系统中的典型用户配置文件由项目向量及其评级组成,随着用户与系统交互的时间推移,这些项目及其评级不断增加。这些系统可以是基于记忆(memory-based)的,直接使用相关性或其他测量方法将用户相互比较,也可以是基于模型(model-based)的,其中模型来自历史评级数据,用于进行预测。基于模型的推荐者已经使用了多种学习技术,包括神经网络,潜在语义索引和贝叶斯网络。
优点:它们完全独立于被推荐对象的任何机器可读表示,并且对于复杂的对象(如音乐和电影)工作良好,因此它不需要领域知识,并且充满了隐式反馈。适合于在一个小而静态的项目范围内,用户兴趣密度相对较高的问题。与基于内容的方法相比,协作方法的最大优势在于其跨类型或“开箱即用”的推荐能力。
缺点:如果项目变化太快,那么对于新用户来说旧的评级信息则价值不大,如果项目集很大,用户兴趣分布很小,那么与其他用户重叠的可能性就很小。并且该方法存在用户以及项目冷启动问题。
CN基于内容的推荐:(项目之间的相关性)基于内容的推荐者根据用户所评价的对象中存在的特征来学习用户兴趣的概要。由基于内容的推荐程序导出的用户兴趣概要的类型取决于所采用的学习方法。决策树、神经网络和基于向量的表示都已经使用。与协作案例一样,基于内容的用户配置文件是长期模型,随着观察到更多关于用户偏好的证据而更新。
优点:不需要领域知识,不存在项目冷启动问题,并且推荐效果随着时间推移而提高,也具有隐式反馈
缺点:存在新用户冷启动问题,需要大量的历史数据集,并且存在稳定性问题,并且该方法不具有跨类型推荐能力。需要对物品进行分析和建模,推荐的质量依赖于对物品模型的完整和全面程度。在现在的应用中我们可以观察到关键词和标签(Tag)被认为是描述物品元数据的一种简单有效的方法。
DM基于人口统计学的推荐:简单的根据系统用户的基本信息发现用户的相关程度,然后将相似用户喜爱的其他物品推荐给当前用户
优点:不需要领域知识,可以实现跨领域推荐,因为不使用当前用户对物品的喜好历史数据,所以对于新用户来讲没有“冷启动(Cold Start)”的问题。
缺