电子商务
windy444
数据挖掘--简单就是美
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
电子商务网站的分词与索引
简单调研了下,京东,淘宝,拍拍都是单字索引,当当,卓越等都是基于分词的索引。 使用什么粒度的索引没有对错,只是各种因素权衡后的一个结果。 单字索引的缺点在于,索引量会大很多,性能也会下降,对于相关性排序的要求也高,会召回大量不相关的商品。优点就是召回率,能够召回的商品都不会遗原创 2011-08-08 14:28:05 · 1610 阅读 · 0 评论 -
Item-based协同过滤
论文:Item-Based Top-N Recommendation Algorithms 过程: 1. 构建一个m*m的矩阵,每一列最多有k个非0值,比如第j列,非0值代表和第j个item最相关的k个item。k一般10-20,不会很大,保持矩阵的稀疏性。 2. 推荐的方式如此:构建m*1的矩阵,表示当前用户购买过的item,1表示购买,0表示未购买。以此为输入, 3. 上述矩阵相乘原创 2011-12-29 13:49:42 · 1363 阅读 · 0 评论
分享