《集体智慧编程》第二章总结:
首先是需要数据
第二是构建好数据集之后,使用数据来度量用户间的相似度,
相似度有以下度量:
参考:http://hi.baidu.com/black/item/79295353bb1bb8dfd58bac62
第三步,相似度求出后,可以将其视作从某用户出发对其它用户的打分,然后可以从该用户出发的对物品的打分,具体是以各用户的打分为加权系数,对所有相关用户(对物品打过分的用户),求和:用户对物品的打分*该用户的打分(加权系数),再除以加权系数之和,示得该物品对该用户的具体得分,越高越好。
以上过程的数据集,如果调整下顺序,不是用户:{物品:分数},而变成物品:{用户:分数}则可以变成物品与物品的相关
然后有一个del.icio.us的例子,此例中的打分仅有1和0两个选项。
最后是基于物品的协作型过滤,没有细讲,推测就是先前调整顺序的算法。
最后的最后,注意两种不同算法的作用场合的分析