
mahout
文章平均质量分 52
重拾梦想
学习是一种信仰
展开
-
Mahout推荐引擎测评及源码分析
评估一个推荐程序:利用平均值来评分:AverageAbsoluteDifferenceRecommenderEvaluator利用均方根来评分:RMSRecommenderEvaluatorpublic void recommenderEvaluator() throws Exception{ DataModel dataModel = new FileDataModel(原创 2014-12-19 18:27:38 · 1028 阅读 · 0 评论 -
用户相似性度量
PearsonCorrelationSimilarity(皮尔逊相关系数)原理:度量两个意义对应数列之间的线性相关程度,即度量两个数列中数字一起增大或一起减小的可能性。场景:用于度量两个用户之间的相似性,度量两个用户针对同一物品的偏好值变化趋势的一致性。优点:结果直观。缺点:没有考虑到两个用户同时给出偏好值的数目。解决办法:引入权重,即加权。 例如,两个用户如原创 2014-12-24 15:48:26 · 3505 阅读 · 0 评论 -
GenericUserBasedRecommender推荐引擎源码分析
推荐程序中,用户需要根据数据类型构建适当的推荐引擎,例如:Recommender recommender = new GenericUserBasedRecommender(dataModel, neighborhood, usersimilarity); 其中dataModel为数据模型,neighborhood为用户领域模型,usersimilarity为相似度模型,在此不详述。构建好原创 2014-12-25 13:41:09 · 1799 阅读 · 0 评论 -
mahout推荐引擎总结
GenericUserBasedRecommender和GenericItemBasedRecommender处理有偏好值的数据。GenericBooleanPrefUserBasedRecommender:处理偏好值为布尔类型或没有偏好值的数据。SlopeOneRecommender:基于新物品与用户评估过的物品之间平均偏好值差异来预测用户对新物品的偏好值。处理有偏好值的数据原创 2014-12-30 14:18:06 · 783 阅读 · 0 评论