互谅网行业,推荐无处不在。推荐的方法大致分为2类——基于用户相识度的推荐,基于物品关联的推荐。
1. 基于用户相识度的推荐
用户相识度计算是通过用户的行为计算用户的“距离”。
用户行为有多个维度,比如对某个商品的打分,用户的年龄、职业,用户浏览的站点等等。
就购买行为来讲,有用户的购买商品,浏览的商品,购买商品的价格,购买商品的关联等。比如一个男士买啤酒后,又买了尿布,很可能说明他家里有个怀孕的太太,那么可以推荐一些怀孕相关的商品。
2. 基于物品关联的推荐
很多看起来没关系的事务,在某种介质下很有可能产生关联。
如果2个事物有共同特征,那么通过特征项可以将事物关联。如果2个事物没有共同特征,但在某种介质下可以发生关联,比如买了A商品的很多人也会买B商品,即使A和B之间没有共同的属性,他们也可以通过购买者关联起来。
3. 关于特征提取
要找到事物之间的联系,就要通过某些特征或者说维度将事物关联起来。这些特征的选取很关键,可以首先获取很多特征,然后通过算法比如决策树等,从获取的特征中选取决定事物联系的关键特征,给他们赋予权重,权重的确定可以通过机器学习算法不断的优化。
4. 主要的推荐算法
4.1 基于内容的推荐
从关于内容的特征描述得到用户的兴趣。比如通过用户的搜索词,分析用户想要搜索的东西以及爱好。将事物和一些搜索词关联起来,推荐给用户。这种方法不需要用户的数据,因此没有冷开始问题,新的项目也可以得到很好的推荐。
4.2 协同过滤推荐