2013-3-10日志

《集体智慧编程》第二章总结:

 

首先是需要数据

 

第二是构建好数据集之后,使用数据来度量用户间的相似度,

 

相似度有以下度量:

参考:http://hi.baidu.com/black/item/79295353bb1bb8dfd58bac62

 

第三步,相似度求出后,可以将其视作从某用户出发对其它用户的打分,然后可以从该用户出发的对物品的打分,具体是以各用户的打分为加权系数,对所有相关用户(对物品打过分的用户),求和:用户对物品的打分*该用户的打分(加权系数),再除以加权系数之和,示得该物品对该用户的具体得分,越高越好。

 

以上过程的数据集,如果调整下顺序,不是用户:{物品:分数},而变成物品:{用户:分数}则可以变成物品与物品的相关

 

然后有一个del.icio.us的例子,此例中的打分仅有1和0两个选项。

 

最后是基于物品的协作型过滤,没有细讲,推测就是先前调整顺序的算法。

 

最后的最后,注意两种不同算法的作用场合的分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值