基于内容的推荐一般多用于文本推荐中,比如新闻推荐。本质上就是根据文本的信息来预测用户是否感兴趣。一种方法是根据文本的内容和用户的个人兴趣信息计算DICE DISTANCE,即:
2×∣keywords(bi)⋂keywords(bj)∣∣keywords(bi)∣+∣keywords(bj)∣\frac{2\times |keywords(b_{i})\bigcap keywords(b_{j})|}{|keywords(b_{i})|+|keywords(b_{j})|}∣keywords(bi)∣+∣keywords(bj)∣2×∣keywords(bi)⋂keywords(bj)∣
一种是直接计算待推荐的文本和用户过去浏览过的文本间的相似度。根据相似度和评分信息来预测用户对待推荐文本的评分。
借助模型的方法本质上就是文本分类的问题,可以采用各类文本分类算法求解,譬如navie bayes,logistic regression,fasttext,GBDT等或深度学习的方法,这种方法有一个问题是由于没有利用用户本身的信息,单单利用文本内容建模,则对于每个用户都要建立一个模型,因为不同用户的兴趣不同。